随着病例激增,以及对COVID-19病例快速检测返回的高假阴性率产生更多问题,一种简单、新的诊断检测方法可以提供更高的准确性。世界各地的研究人员发现,人工智能可以在有记录的强迫咳嗽中检测冠状病毒感染,在无症状或症状前病例中准确率接近100%,使其成为一种理想的快速筛查测试。强迫咳嗽或声音分析在其他情况下也有明显的效果,包括肺动脉高压,令人惊讶的是,阿尔茨海默氏症。
马萨诸塞州剑桥市麻省理工学院(MIT)的研究人员;马萨诸塞州牛顿市的Vocalis Health Inc.是一家医疗机构。以色列海法和;和英国剑桥大学都启动了使用声音或咳嗽样本诊断COVID-19的项目。
到目前为止,麻省理工学院的团队似乎是这场竞赛的赢家。在最近发表在《IEEE医学和生物学工程杂志》上的一篇论文中,该团队揭示了它的开放声音模型仅通过他们的咳嗽记录就能非常准确地识别出感染了SARS-CoV-2的人。对于有COVID-19症状的个体,与金标准RT-PCR结果相比,该模型的敏感性为98.5%,特异性为94.2%,但对于无症状个体,敏感性为100%,特异性为83.2%。
虽然该测试能可靠地检测到有症状的人的感染,但作者建议主要在没有症状的人身上使用。麻省理工学院自动识别实验室的研究科学家、首席作者布莱恩·苏比拉纳(Brian Subirana)告诉《生物世界》(BioWorld),部分原因是该测试在有症状的人群中不太准确,部分原因是“人们应该直接去看医生,并得到适当的医疗建议。”
该团队正在开发一款基于该模型的应用程序,提供一种非侵入性、实时、即时分布的COVID-19筛查工具,可用于替代不太可靠的快速检测,用于筛查无症状学生、公共交通乘客、大型聚会的参与者、员工和商店顾客。
训练人工耳
人的耳朵检测不出COVID-19患者和没有感染的人发出的咳嗽的差异,但作为模型基础的卷积神经网络可以。
“说话和咳嗽的声音都会受到声带和周围器官的影响,”苏比拉纳说。这意味着当你说话时,你说话的一部分就像咳嗽,反之亦然。这也意味着,我们很容易从流利的讲话中得到的东西,人工智能可以从咳嗽中得到,包括人的性别、母语,甚至情绪状态。”
事实证明,单凭咳嗽就能很好地诊断COVID-19,但从读数或其他录音中获得的额外信息可能会进一步改善这种情况。苏比拉纳说:“我们的研究集中在咳嗽上,看看我们能走多远。”
目前的准确度水平很大程度上来自于大规模数据库的使用。当阿尔茨海默病的流行超过了其他研究时,该实验室一直在研究一种人工智能,通过强迫咳嗽记录来检测阿尔茨海默病。除了痴呆症,阿尔茨海默氏症还与神经肌肉退化有关,这使得声带减弱,言语功能明显变平。
到今年春天,研究小组已经对神经网络进行了训练,其中包括超过1000小时的有声书数据集,以及数小时演员表达各种情绪的录音和10000次咳嗽的数据库。老年痴呆症的早期结果显示出很强的预测能力,曲线下的区域接近0.9。
整个5月份,研究小组又收集了7万份录音,总计20万份强迫咳嗽样本。其中约有2500例可确诊的COVID-19病例。利用这2500个阳性样本和另外随机抽取的2500个样本,他们对AI进行了4000个录音的训练,并对剩下的1000个录音进行了验证。
其他录音应用程序
Vocalis Health开发了一个类似的应用程序,使用50到70岁人群的录音。他们还要回答关于他们症状的问卷。以色列国防部自4月份以来一直在使用这种技术检测国内的COVID-19感染病例。
Vocalis Health的联合创始人、首席运营官和首席医疗官Shady Hassan说:“目前的检测和筛查方法不够充分,资源密集,而且滥用。”“我们开发了一种COVID-19发声生物标志物,因为它是一种高度可扩展和非侵入性的筛查工具,可以通过扩大筛查的范围和可靠性,更好地提供信息和指导测试,来帮助填补这一空白。”
该公司的人工智能还与梅奥诊所(Mayo Clinic)合作用于诊断肺动脉高压,其相关系数为0.829。
这两种应用程序都将音频记录转换为由计算机视觉技术处理的视觉图像,以识别光谱图中的微小变化,然后由算法生成每种疾病和每种患者的独特特征。
哈桑解释说:“人类的发声系统包括肺部和提供空气供应的下气道,声带通过振动调节气流,产生声源,而声源由舌头和嘴调节。”“COVID-19和肺动脉高压都会影响这些器官,因此可以通过声音检测出来。”
该公司指出,语音记录为患者诊断提供了一种新途径,可能对远程医疗应用程序和远程疾病监测特别有价值。