《合成数据加速用于 X 射线图像分析的基于ML的可推广算法开发》

  • 来源专题:数智化图书情报
  • 编译者: 闫亚飞
  • 发布时间:2023-07-11
  • 近日,约翰斯·霍普金斯大学(Johns Hopkins University)的研究人与证明了从人体模型创建逼真的模拟图像是一种可行的替代方案,是对大规模原位数据收集的补充。在真实合成数据上训练 AI 图像分析模型,结合当代领域泛化技术,可以生成在真实数据上训练的机器学习模型,其性能与在精确匹配的真实数据训练集上训练的模型相当。

    研究人员展示了被称为 SyntheX 的 X 射线图像分析模型传输范例,由于在更大的数据集上训练的有效性,甚至可以胜过真实数据训练的模型。SyntheX 提供了一个显著加速基于 X 射线的智能系统的概念、设计和评估的机会。

    此外,SyntheX 提供了测试新仪器、设计互补手术方法和设想新技术的机会,这些技术可以改善结果、节省时间或减少人为错误,而无需考虑实时人类数据收集的伦理和实践考虑。

    到目前为止,还没有研究使用跨领域精确匹配的数据集来隔离领域泛化的影响。这项工作还展示了一种可行且具有成本效益的方法来训练 AI 图像分析模型以对合成数据进行临床干预,其性能可与多种应用中的真实临床数据训练相媲美。另外,模型的性能随着合成训练样本数量的增加而大幅提高,这突出了 SyntheX 的关键优势:为模型训练或预训练提供大量注释良好的数据。

    使用合成数据训练机器学习算法正受到越来越多的关注。在一般计算机视觉中,Sim2Real 问题已针对自动驾驶感知和机器人操作进行了广泛探索。在诊断医学图像分析中,基于 GAN 的新样本合成已被用于增强磁共振成像、超声、视网膜、皮肤病变和 CXR 图像的可用训练数据。在计算机辅助干预中,Sim2Real 问题的早期成功包括对内窥镜图像和术中 X 射线的分析。这里的对照研究表明 Sim2Real 优于 Real2Real 训练,从而在 X 射线领域验证了这种方法。

相关报告
  • 《开发基于人工神经网络的ECMWF全球水平辐射预报校正算法》

    • 来源专题:可再生能源
    • 编译者:pengh
    • 发布时间:2019-05-10
    • 本文提出了一种校正算法,用于提高从欧洲中期天气预报中心(ECMWF)的数值天气预报(NWP)模型获得的全球水平辐射(GHI)预报的准确性。首先,将GHI预测与位于葡萄牙南部(Évora和Sines)的两个地面站的实验值进行比较,并分析了太阳 - 地球几何和大气变量对预测和测量之间差异的影响,以便确定最相关的参数。这些差异主要与清晰度指数,太阳天顶角,平均气温,相对空气湿度和总水柱有关。由于ECMWF模型直接或间接地提供了所有这些变量,因此可以将预测GHI的偏差估计为预测数据的函数,作为参考测量值,这意味着基于这些参数的相关性的算法可用于在运营时间范围内正确预测。为此目的,在这项工作中开发了一种基于人工神经网络(ANN)的算法来改进GHI预测,包括作为参考晴天模型预测的全球太阳辐射的输入。优化了ANN的内部结构,并且还开发了空间和时间缩小程序以获得半小时的辐照值。该算法针对原始ECMWF预测和四个具有不同地形和气候以及各种天空条件(阴天,部分多云和晴空)的地点的持久性模型进行了测试,表明它成功地改进了模型预测。基于七个统计指标和预测分数(FS)的全局绩效指数(GPI)的较高值被发现用于算法模拟,例如,当考虑所有位置和云覆盖条件时,分别为1.066和0.348,而对于原始ECMWF预测,GPI为-1.874,FS为0.282。如果将该算法集成到太阳能系统的能量管理工具中,即低/中温太阳能热和光伏系统,则该算法是有用的。 ——文章发布于2019年6月
  • 《新算法加速材料的开发及优化》

    • 来源专题:航材院监测服务
    • 编译者:万勇
    • 发布时间:2018-06-11
    • 目前汽车的燃料效率最高约为40%,即有约60%的燃油能量通过排气管和散热器浪费掉。如果利用热电材料对汽车废热进行回收,可以提高约5%的燃油效率。但由于热电系统非常复杂,对半导体材料有特殊的性能要求(包括高导电、高热电势和低热导率等),因而热电材料成本较为昂贵。除此以外,热电材料开发耗时严重,例如由铪和锆(最常用于核反应堆的元素)组成的先进材料,从最初的发现到最优性能的确定,花费了15年的时间。 为了解决前述问题,哈佛大学工程与应用科学学院的研究人员开发了一种基于量子力学方程的算法,不需要进行任何实验辅助,就可以在几个月内发现并优化热电材料。该算法只根据晶体中的化学元素来预测材料的电子传输特性。其关键在于简化电子-声子散射的计算方法,与现有算法相比,其运算速度提高约1万倍。使用这种改进的算法,研究人员筛选出多种可能的晶体结构,其中有一些是从未合成过的。研究人员从中筛选了几个有趣的结构,做了进一步优化,将性能最优者交由实验团队合成。 实验人员通过合成计算优选出来的材料,发现了一种与以前的热电材料同样高效和稳定的材料,但价格却便宜了10倍。并且从最初的筛选到合成只用了15个月的时间。研究人员下一步希望改进这种新方法,并利用它来探索更广泛的新型特殊材料,如拓扑绝缘材料。 相关研究工作发表在Advanced Energy Materials(文章标题:Accelerated Screening of Thermoelectric Materials by First‐Principles Computations of Electron–Phonon Scattering)。