心血管疾病(CVDs)影响心脏和血管,在欧洲估计每天造成10000人过早死亡。对于正确检测潜在的心脏问题,如局部缺血或可能导致中风的心律失常,至关重要的是使用非侵入性导线获得的心电图(ECG)数据来记录心脏的电信号。
近日,机器学习的出现使得能够以非主观的方式高精度地自动检测此类事件。然而,为了训练软件,并允许将算法与定义的指标(称为“基准测试”)进行直接比较,需要大型心电图信号数据库,而这些数据库在2018年之前并不容易获得。
现已完成的EMPIR项目心律失常管理自动化数据分析计量(18HLT07,MedalCare)解决了这一问题。
心电图数据库
为了解决这一不足,该项目开发了许多心电图数据库,并将其发布给心脏病学界:
PTB-XL
该项目的早期成果是简化了大型心电图数据库PTB-XL的发布,并附有一篇论文:“PTB-XL,一个大型的公开心电图数据集。”该数据集由德国国家计量研究所(NMI)PTB收集,全面收集了18869名患有多种不同合并症的患者和大部分健康对照样本的21799份临床12导联心电图。
PTB-XL+
使用两个商业心电图分析软件包和项目内开发的开源软件包“ECGDeli”从PTB-XL中提取临床特征,并作为PTB-XL+发布。非标准心电图特征也被考虑使用PTB-XL+并用于基准测试,并得到了论文的支持:“PTB-XL+,一个全面的心电图特征数据集”
MedalCare XL
该项目还首次建立了具有数字地面真实参考值的心电图数据“虚拟群体”。这个合成数据库MedalCare
XL包含16900个基于多尺度机械电生理模拟的导联心电图,平均分布在1个健康对照组和7个病理组中。发表了一篇论文:“MedalCare XL:16900个通过电生理模拟获得的健康和病理12导联心电图”,以支持其使用。该数据库分为训练、验证和测试部分,用于开发和客观评估新的机器学习算法。根据PTB-XL数据库验证了合成数据,该数据库证明合成信号以高保真度代表健康和病理亚群的临床心电图。它通过应用基于神经网络的机器学习算法和专家在临床图灵测试框架内检查的一个子部分进行了交叉验证。
其他项目成果
临床图灵测试
为了检查MedalCare XL数据库中的合成心电图是否会在诊断条件下作为临床信号通过,进行了临床图灵测试:要求受过医学训练的心脏病学家确定心电图痕迹是来自真实患者还是来自合成MedalCare-X数据库。临床图灵测试表明,一些方法通常表现良好,而另一些方法表现不佳,为改进电生理学建模及其诊断能力提供了宝贵的反馈。
ECGDeli软件
在MedalCare期间,卡尔斯鲁厄理工学院(KIT)开发了一种开放获取工具,用于从临床和虚拟数据集中提取心电图特征,ECGDeli以及配套出版物:“ECGDeli-MATLAB的开源心电图描绘工具箱”。除了通过分析心电图信号对特定心脏病的诊断做出贡献外,该软件还可以用于扩展现有算法或作为新算法的基准。
心脏病学挑战
在项目接近尾声时,PTB-XL数据库成功用于在2020年心脏病学挑战赛的PhysioNet计算中测试新的心电图算法,用于12导联心电图的分类,以及在2021年心脏病学挑战赛的不同维度的PhysioNet计算中测试心电图。
在长期项目中,结果将使心电图轨迹更加清晰,从而能够以清晰、无偏见的方式自动检测心脏缺血和心律失常等病理。
负责协调该项目的Markus B?r(PTB)在谈到这项工作时表示:“该项目之所以非常成功,是因为它不同寻常地结合了专业知识——用于实施真实心脏模型的建模专家、用于模拟和机器学习应用中不确定性量化的计量学家,以及在最佳描述为临床图灵测试的练习中审查、指导和帮助改进基础模型的心脏病学家。总之,MedalCare项目产生了合成心电图数据库(虚拟队列)的第一个例子,并提出了验证和改进它的方法。同时,它为基于临床记录的心电图特征提供了一个新的广泛数据库,并为诊断机器学习算法的基准协议和不确定性评估提供了建议。除了该项目的许多广受欢迎的出版物外,其成功可能最好地体现在以下事实中:这些产出正被用于新的项目联盟,如欧盟TEF项目(测试设施)的医疗应用,数据库由各个合作伙伴进一步扩展,并被其他研究人员用于大量研究。”
该EMPIR项目由欧盟地平线2020研究和创新计划和EMPIR参与国共同资助。