一种可以分析血细胞形状和形式异常的人工智能工具,比人类专家更准确、更可靠,可能会改变白血病等疾病的诊断方式。
研究人员创建了一个名为细胞扩散的系统,该系统使用生成式人工智能(DALL-E等图像生成器背后的同类技术)来研究血细胞的形状和结构。
与许多被训练来简单识别模式的人工智能模型不同,由剑桥大学、伦敦大学学院和伦敦玛丽女王大学的研究人员开发的细胞扩散可以准确识别各种正常的血细胞外观,并发现可能表明疾病的不寻常或罕见的细胞。研究结果发表在《自然机器智能》杂志上。
发现血细胞大小、形状和外观的细微差异是诊断许多血液疾病的基础。但是这项任务需要数年的训练,即使这样,不同的医生在疑难病例上也会有分歧。
“我们都有许多不同类型的血细胞,它们在我们体内具有不同的属性和不同的作用,”剑桥大学应用数学和理论物理系的西蒙·德尔塔达尔说,他是该研究的第一作者。“例如,白细胞专门对抗感染。了解不寻常或患病的血细胞在显微镜下是什么样子,是诊断许多疾病的重要组成部分。”
然而,一个典型的血液“涂片”包含数千个细胞——远远超过任何人可以分析的数量。“人类无法看到涂片中的所有细胞——这是不可能的,”Deltadahl说。“我们的模型可以自动化这一过程,对常规病例进行分类,并突出任何不寻常的情况供人工审查。”
“作为一名初级血液医生,我面临的临床挑战是,在一天的工作之后,我将有很多血液片要分析,”来自伦敦玛丽女王大学的合著者Suthesh Sivapalaratnam博士说。“当我在深夜分析它们时,我开始相信AI会比我做得更好。”
为了开发细胞扩散,研究人员在剑桥阿登布鲁克医院收集的超过50万张血液涂片图像上训练了该系统。该数据集是同类中最大的,包括常见的血细胞类型和罕见的样本,以及可能使自动系统混淆的元素。
通过对细胞外观的完整分布进行建模,而不仅仅是学习区分类别,人工智能对医院、显微镜和染色方法之间的差异变得更加强大,并且能够更好地识别罕见或异常的细胞。
在测试中,细胞扩散可以检测与白血病有关的异常细胞,其灵敏度远远高于现有系统。它还匹配或超过了当前最先进的模型,即使给出的训练样本少得多,并量化了自己的不确定性。
“当我们测试其准确性时,该系统略好于人类,”Deltadahl说。“但它真正突出的地方在于知道什么时候是不确定的。我们的模型永远不会说它是确定的,然后是错误的,但这是人类有时会做的事情。”
“我们针对现实世界人工智能中遇到的许多挑战评估了我们的方法,例如从未见过的图像,不同机器捕捉的图像以及标签的不确定性程度,”共同高级作者Michael Roberts教授说,他也来自剑桥大学应用数学和理论物理系。“这个框架提供了模型性能的多面视图,我们相信这将有利于研究人员。”
该团队还表明,细胞扩散可以产生与真实血细胞难以区分的合成血细胞图像。在一次有10名经验丰富的血液学家参加的“图灵测试”中,人类专家在从人工智能生成的图像中分辨真实图像方面没有任何优势。
“这真让我吃惊,”德尔塔达尔说。"这些人整天盯着血细胞,甚至他们也看不出来."
作为该项目的一部分,研究人员正在发布他们所说的世界上最大的公开的外周血涂片图像数据集:总共超过50万。
“通过开放这一资源,我们希望让全球的研究人员能够建立和测试新的人工智能模型,实现高质量医疗数据的民主化,并最终为更好的患者护理做出贡献,”Deltadahl说。
虽然结果很有希望,但研究人员表示,细胞扩散不能取代训练有素的临床医生。相反,它旨在通过快速标记异常案例以供审查并自动处理更多常规案例来支持他们。
“医疗保健人工智能的真正价值不在于以更低的成本接近人类的专业知识,而在于提供比专家或简单的统计模型更强的诊断、预测和说明能力,”来自UCL的共同高级作者Parashkev Nachev教授说。“我们的工作表明,生成式人工智能将是这项任务的核心,不仅改变了临床支持系统的保真度,还改变了他们对自身知识局限性的洞察力。这种‘元认知’意识——知道自己不知道的东西——对临床决策至关重要,这里我们展示了机器在这方面可能比我们做得更好。”
研究人员表示,需要进一步的工作来使该系统更快,并在不同的患者群体中进行测试,以确保公平性和准确性。
这项研究得到了三一挑战、惠康、英国心脏基金会、剑桥大学医院NHS基金会信托、Barts Health NHS信托、NIHR剑桥生物医学研究中心、NIHR UCLH生物医学研究中心和NHS血液和移植的部分支持。这项研究是由成像工作组进行的血液计数!财团,旨在利用人工智能在全球范围内改善血液诊断。Simon Deltadahl是剑桥大Lucy Cavendish学院的成员。