在本研究中,一个基本的知识缺口问题是通过评估SARS‐CoV‐2的生物学和病原学方面的差异,以及SARS‐CoV‐2与之前两次主要的CoV流行(SARS和MERS冠状病毒)相比的变化来解决的。对四个结构基因的基因组组成、核苷酸分析、密码子使用指数、相对同义密码子使用(RESU)和有效密码子数量(ENc)进行了分析;穗(S)、包膜(E)、膜(M)和核衣壳(N)基因,以及两个最重要的非结构基因,包括来自穿山甲、蝙蝠、MERS和SARS CoVs的SARS‐CoV‐2、Beta‐CoV的RNA依赖RNA聚合酶(RdRP)和主要蛋白酶(Mpro)。这些基因包括穗(S)、核衣壳(N)、包膜(E)和膜(M)基因。结果:SARS‐CoV‐2比嘌呤更喜欢富含嘧啶的密码子。大多数高频密码子以A或T结尾,而低频和罕见的密码子以G或c结尾。与SARS、bat SARS和MERS CoVs相比,SARS‐CoV‐2结构蛋白显示出5‐20个较低的ENc值。这意味着SARS‐CoV‐2结构蛋白具有更高的密码子偏置和更高的基因表达效率。SARS‐CoV‐2编码了最多的超偏码和负偏码。穿山甲甲‐CoV与SARS‐CoV 2 ENc值相比,与SARS、蝙蝠SARS和MERS CoV相比,差异不大。结论:SARS‐CoV‐2的极端偏倚和较低的ENc值,特别是在穗、包膜和Mpro基因中,提示与SARS、bat SARS和MERS CoVs相比,具有更高的基因表达效率。