这项研究旨在通过主题建模分析来评估涉及冠状病毒以及COVID-19的出版物的特征。方法:我们提取了所有摘要,并保留了COVID-19开放研究数据集中信息最丰富的词,该数据集包含了截至2020年3月20日出版的所有35,092篇冠状病毒相关文献。使用潜在狄利克雷分配模型,我们训练了八个语料库中的主题模型。然后,我们分析了主题之间的语义关系,并比较了COVID-19与其他CoV感染之间的主题分布。结果:总共出现了八个主题:临床表征,发病机理研究,疗法研究,流行病学研究,病毒传播,疫苗研究,病毒诊断和病毒基因组学。据观察,COVID-19研究目前更加重视临床表征,流行病学研究和病毒传播。相比之下,有关诊断,治疗,疫苗,基因组学和发病机制的主题仅占所有COVID-19出版物的不到10%甚至4%,远低于其他CoV感染的出版物。结论:这些结果确定了COVID-19领域的知识差距,并为将来的研究提供了方向。