随着2019冠状病毒疾病(COVID-19)爆发的进行,需要流行病学数据来指导情况意识和干预策略。在这里,我们描述了从新闻媒体和社交网络收集和传播有关COVID-19的流行病学信息。方法:在本人群水平的观察性研究中,我们搜索了DXY.cn,这是一个面向保健的社交网络,报道来自中国地方和国家卫生机构的有关COVID-19的新闻。我们编制了一份清单,列出了中国2020年1月13日至1月31日之间COVID-19的个体患者和省份的每日病例数。我们还从全球新闻媒体(共同社,海峡时报和CNN),各国政府和卫生当局收集了国际出口的COVID-19病例清单。我们评估了COVID-19的流行病学趋势,并研究了中国各地的疫情进展,评估了症状发作,在医院或诊所就诊之间的延迟。所有数据均实时公开提供。研究结果:我们收集了2020年1月13日至1月31日期间报告的507例COVID-19患者的数据,其中364例来自中国大陆,143例来自中国境外。 281名患者(55%)为男性,中位年龄为46岁。很少有患者(13 [3%])小于15岁,根据基线人口统计数据对中国患者的年龄进行了调整,证实儿童感染不足。在整个分析期间,湖北省的症状发作与在医院或诊所就诊之间的延迟时间比中国大陆和国际上的其他省份更长。在中国大陆,就诊延迟时间从2020年1月18日之前的5天减少到直到2020年1月31日的2天。尽管在分析期间,我们的样本仅获取了官方来源报告的9826例COVID-19患者中的507名(5·2%),但我们的数据与2020年1月28日中国当局发布的官方报告一致。媒体可以帮助重建疾病暴发的过程,并在紧急医疗情况下提供详细的患者水平数据。随着疫情的进展,社交媒体和新闻报道可能会由于报道疲劳和医疗体系不堪重负而在全球范围内减少的COVID-19病例。在疫情爆发的早期阶段,公共数据集的可用性对于鼓励独立团队进行分析工作并提供有力的证据来指导干预至关重要。