该研究使用MLDSP和MLDSP-GUI对2019-nCoV进行了分类,这是使用机器学习(ML)和数字信号处理(DSP)进行基因组分析的免比对方法。使用二维数值表示将基因组序列映射到其各自的基因组信号中。通过对基因组信号应用离散傅里叶变换来计算幅度谱。利用距离矩阵构造特征向量,并将其用作监督机器学习算法的输入。应用10倍交叉验证来计算平均分类准确性得分。经训练的分类器模型用于预测29个2019-nCoV序列的标签。分类策略使用了5000多个基因组,并在域到种的分类学水平上测试了关联。通过使用MLDSP-GUI的基于机器学习的无比对分析,研究人员证实了蝙蝠起源的当前假说,并将2019-nCoV分类为β冠状病毒中的Sarbecovirus。