牛津大学的研究人员于2020年2月19日在The Lancet Infectious Diseases发表题为“Open access epidemiological data from the COVID-19 outbreak”的通讯文章。
2019年冠状病毒病(COVID-19)在中国迅速蔓延。在流行病早期,获得准确和可靠的流行病学、临床和实验室数据,对于指导公共卫生决策非常重要。流行病学信息的记录,了解传染性、地理传播风险、传播途径和感染风险因素,可为流行病学建模提供基线,为应对规划和控制措施提供信息。疫情爆发期间,很少能公开实时数据,使用各种模型和假设进行多种分析,有助于达成共识。这与基因组数据的开放共享存在相似之处。
研究人员建立了个人信息库,用于收集实验室确诊的COVID-19患者(在中国,通过在市和省疾病预防控制中心检测病毒核酸确认)病理信息,包括出行历史、位置(可用的最高分辨率和相应的经纬度)、症状和报告的发病日期,以及确认日期和基本人口统计数据。信息有多种来源,包括世卫组织、卫生部以及中国地方、省和国家卫生部门的官方报告。数据公开并定期更新(大约每天两次)。这些数据可为规划、建模和流行病学研究建立证据,更好地向公众、决策者、国际组织和资助者通报所处位置以及如何改进监测、应对工作和资源提供,这是控制COVID-19流行病的关键因素。
COVID-19流行病正在迅速蔓延,有必要建立计算基础设施,以应付的病例报告大量增加。数据共享对于评估和维持准确的病例报告至关重要。