《Nature:构建出一种计算机模型,可以准确预测新冠肺炎在美国10个大型城市的传播情况》

  • 来源专题:生物安全知识资源中心 | 领域情报网
  • 编译者: hujm
  • 发布时间:2020-11-15
  • 在一项新的研究中,来自美国斯坦福大学和西北大学的研究人员构建出一种计算机模型,并利用这种模型通过分析驱动感染风险的三个因素---人们在一天中去了哪里,停留了多长时间,以及有多少其他人在同一时间访问同一地点---准确预测了今年春天COVID-19在美国10个主要城市的传播情况。相关研究结果于2020年11月10日在线发表在Nature期刊上,论文标题为“Mobility network models of COVID-19 explain inequities and inform reopening”。

    论文通讯作者、斯坦福大学计算机科学家Jure Leskovec说,“我们构建了一种计算机模型,来分析不同人口背景、不同社区的人是如何访问不同类型的地方,这些地方或多或少都是拥挤的。基于所有这些因素,我们可以预测在任何给定地点或时间发生新感染的可能性。”

    这项研究合并了人口统计学数据、流行病学估计和匿名手机位置信息,似乎证实了大多数COVID-19传播发生在“超级传染源(superspreader)”场所,比如全方位服务的餐馆、健身中心和咖啡馆,在那里,人们长时间地呆在狭小的空间里。这些研究人员说,他们的模型可以作为官员们的工具,通过揭示新感染和销售损失之间的权衡,帮助他们在重新开始营业(比如在20%或50%的营业能力下)时尽量减少COVID-19的传播。

    论文共同作者、坦福大学人文与科学学院社会学教授David Grusky说,这种预测能力特别有价值,这是因为它针对少数族裔和低收入人群不成比例的感染率背后的因素提供了有用的新见解。他说,“在过去,这些差异被认为是由已存在的医疗状况和不平等的医疗服务驱动的,而我们的模型表明,人群流动模式也有助于推动这些不成比例的风险。”

    Grusky说,该模型显示了重新开放占用上限(occupancy caps)较低的企业往往最有利于弱势群体。Grusky 说,“这是因为雇佣少数族裔和低收入人群的地方往往规模较小,而且更加拥挤,对重新开业的商店设置入住上限可以降低他们面临的风险。我们有责任建立重新开业计划,从而消除--或至少减少--当前做法所造成的不平等。”

    Leskovec说,这种模型“提供了迄今为止最有力的证据”,表明今年春天颁布的待在家里的政策减少了外出旅行的次数,并减缓了新感染的速度。

    追随脚步

    这项研究追踪了全美10个最大的大都会区9800万美国人在50万个不同场所(从餐馆、健身中心到宠物店和新车经销商)的活动。

    这些研究人员包括斯坦福大学博士生Serina Chang、Pang Wei Koh和Emma Pierson(今年夏天毕业),以及西北大学的研究员Jaline Gerardin和Beth Redbird,他们为这10个大都会区收集研究数据。按照人口顺序,这些城市包括纽约、洛杉矶、芝加哥、达拉斯、华盛顿特区、休斯顿、亚特兰大、迈阿密、费城和旧金山。

    作为一家从移动应用中汇集匿名位置数据的公司,SafeGraph给这些研究人员提供的数据显示,在553000个公共场所中,人们每天去了哪些地方,如五金店和宗教场所;去了多长时间;关键的是,每个场所的面积是多少,这样这些研究人员就可以确定每小时的占用密度(occupancy density)。

    这些研究人员分两个不同的阶段对3月8日至5月9日的数据进行了分析。在第一阶段,他们向他们的模型输入流动性数据,并设计他们的模型系统来计算一个关键的流行病学变量:这种病毒在这10个大都市地区各种不同情况下的传播率。在现实生活中,人们不可能提前知道感染者和易感者何时何地接触,从而产生潜在的新感染。但在这种模型中,他们开发并完善了一系列方程来计算不同地点和时间发生感染事件的概率。这些方程之所以能够解决未知变量,是因为他们向计算机输入了一个重要的已知事实:每个城市每天有多少COVID-19感染病例被报告给卫生官员。

    这些研究人员完善了这种模型,直到它能够确定这种病毒在每个城市的传播率。传播率因城市而异,这取决于各种因素:从人们出家门的频率到他们去了哪些类型的场所。

    一旦这些研究人员获得了这10个大都市的传播率,他们就在第二阶段测试了这种模型,要求它将每个城市的传播率与它们的流动模式数据相乘,以预测新的COVID-19感染情况。所获得的预测结果与卫生官员的实际报告结果密切相关,这使得这些研究人员对这种模型的可靠性充满信心。

    预测感染

    通过将这种模型与57000个人口普查街区组(600至3000人的街区)数据库中的人口数据相结合,这些研究人员展示了少数族裔和低收入人群如何因为工作需要而更频繁地离开家,并在较小的、更拥挤的场所购物,而不是像收入较高的人那样,他们可以在家工作,使用送货上门来避免购物,并在外出时光顾更宽敞的营业场所。比如,这项研究显示,与白人相比,非白人人群购买杂货被感染的风险大约是白人的两倍。Chang说,“通过合并流动性、人口统计学和流行病学数据集,我们能够利用我们的模型来分析不同重新开放营业政策的有效性和公平性。”

    这些研究人员已经公开了他们所使用的工具和数据,以便人们可以重现这些发现并在这些发现的基础上进行新的研究。

    Leskovec说,“原则上,任何人都可以使用这种模型来了解不同待在家里和企业关闭政策决定的后果。”他的团队如今正在努力将这种模型开发成一种方便用户的工具,供政策制定者和公共卫生官员使用。

  • 原文来源:https://news.bioon.com/article/6780808.html;https://www.nature.com/articles/s41586-020-2923-3;https://medicalxpress.com/news/2020-11-team-covid-cities.html
相关报告
  • 《开发并验证一种早期新冠肺炎快速筛查模型,对预测早期新冠肺炎具有高灵敏度和特异性》

    • 来源专题:新发突发疾病(新型冠状病毒肺炎)
    • 编译者:蒋君
    • 发布时间:2021-06-24
    • 2021年6月18日,浙江省人民医院等机构的研究人员在Medicine上发表研究论文,开发并验证一种快速筛查模型,以便使用随机森林算法预测中国疑似新冠肺炎病例中的早期新冠肺炎[6]。研究初始共纳入914例疑似新冠肺炎病例。采用随机森林算法建立基于训练集的快速筛查模型。筛查模型通过验证的混淆矩阵和接受者操作特征(ROC)分析进行评估。快速筛查模型根据4种流行病学特征、3种临床表现、白细胞计数和淋巴细胞减少以及胸部X射线或计算机断层扫描的影像学改变来建立。混淆矩阵显示,前瞻性筛查模型预测早期新冠肺炎的准确率为87.0%,对预测早期新冠肺炎具有高灵敏度和特异性。
  • 《JAMA:探究美国新冠肺炎疫情期间的超额死亡人数》

    • 来源专题:生物安全知识资源中心 | 领域情报网
    • 编译者:hujm
    • 发布时间:2020-10-20
    • 新型冠状病毒SARS-CoV-2导致2019年冠状病毒病(COVID-19),如今正在全球肆虐。之前对COVID-19大流行期间的超额死亡人数(excess death)---指的是观察到的死亡人数与预期死亡人数之间的差距---的研究发现,公开报告的COVID-19死亡人数低估了全部死亡人数,其中包括记录在案的和未记录在案的由这种病毒感染造成的死亡人数,以及因这次大流行造成的破坏而导致的非COVID-19死亡人数。 之前的分析发现,在这次大流行的前几周(2020年3月至4月),超额死亡人数中只有65%提到了COVID-19;在美国COVID-19死亡人数最多的5个州中,非COVID-19原因(比如阿尔茨海默病、糖尿病和心脏病)的死亡人数急剧增加。 在一项新的研究中,来自美国弗吉尼亚联邦大学医学院和耶鲁大学公共卫生学院的研究人员对美国超额死亡人数的估计更新到了2020年8月1日,并探讨了与国家重新开放(解除冠状病毒限制)的时间关系。相关研究结果于2020年10月12日在线发表在JAMA期刊上,论文标题为“Excess Deaths From COVID-19 and Other Causes, March-July 2020”。 研究方法 2014~2020年的死亡数据以及50个州和哥伦比亚特区的人口数量分别来自美国国家卫生统计中心和美国人口普查局。2020年3月1日至2020年8月1日的死亡人数取自2020年9月9日发布的临时性未加权数据。康涅狄格州和北卡罗来纳州因数据缺失而被排除在外。一种层次泊松回归模型被用来预测基于历史标准的预期死亡。COVID-19死亡包括那些COVID-19被认为是潜在或促成原因的死亡。未归因于COVID-19的死亡数据仅可用于潜在死亡原因,包括阿尔茨海默病、心脏病和其他10种用于分组的死因。重新开放日期从《纽约时报》获得。 为了确认观察到的非COVID-19死亡人数增加的有效性,Joinpoint回归程序(version 4.8.0.1;美国国家癌症研究所统计研究与应用处)被用来确定斜率变化的周数(joinpoints)(以年度百分比变化[APC]来衡量)及其统计学意义(两边检验,0.05阈值)。为了估计美国各个州的流行病曲线的离散性,计算了出现90%超额死亡人数(ED90)的连续周数。所有计算均在软件SAS(version 9.4;SAS研究所)和R(3.6.1版;R基金会)中进行。 研究结果 在2020年3月1日至8月1日期间,美国发生了1336561例死亡病例,比预期死亡人数增加了20%(1111031[95% CI,1110364至1111697])。人均超额死亡率最高的10个州是纽约州、新泽西州、马萨诸塞州、路易斯安那州、亚利桑那州、密西西比州、马里兰州、特拉华州、罗德岛州和密歇根州。人均超额死亡率最高的州每周都有变化。这些州的绝对死亡人数相对于预期值的增幅从罗德岛州和密歇根州的22%到纽约州的65%不等(表1)。死亡率最高的三个州(新泽西州、纽约州和马萨诸塞州)占美国超额死亡人数的30%,但它们的流行时间最短(ED90<10周)。在4月经历了急性暴涨(并在之后重新开放)的州,具有较短的流行时间,并在5月恢复到基线水平,而较早重新开放的州则经历了更持久的超额死亡人数增加,并延续到夏季。 在225530例超额死亡人数中,150541例(67%)归因于COVID-19。Joinpoint回归程序分析显示,除COVID-19外,其他原因导致的死亡人数出现增加,其中的两种非COVID-19原因达到统计学意义。在3月21日至4月11日的几周内,美国心脏病死亡率有所上升(APC,5.1[95% CI,0.2-10.2]),这是由于COVID-19病例在春季激增所驱动的。在3月21日至4月11日的几周内和6月6日和7月25日的几周内,阿尔茨海默病/痴呆症的死亡率都出现了增加(前者:APC,7.3[95% CI,2.9-11.8];后者:APC,1.5[95% CI,0.8-2.3]),后者与美国阳光地带州的夏季COVID-19病例激增相一致。 探讨 虽然美国的总死亡人数每年都非常一致,但2020年3~7月期间,美国的死亡人数增加了20%。据记录,COVID-19在这些额外死亡人数中仅占67%。美国的一些州在控制社区传播方面比其他州有更大的困难,导致超额死亡人数长期升高,并延伸到夏季。在COVID-19病例激增期间,美国因一些非感染性原因造成的死亡人数有所增加。归因于COVID-19以外原因的超额死亡可能反映了未被确认或未记录的SARS-CoV-2感染导致的死亡,或因这次大流行病造成的破坏导致未感染患者死亡。这项研究的局限性包括对临时数据的依赖、死亡证明中的不准确性以及这种层次泊松回归模型中的假设。