发表在《自然》(Nature)杂志《npj 数字医学》(npj Digital Medicine)上的论文,为人工智能以突破性的效率支持医疗工作者打开了大门。
研究人员训练超级计算机根据新模型 GatorTronGPT 生成医疗记录,该模型的功能与 ChatGPT 相似。
GatorTron? 模型的免费版本在开源人工智能网站 Hugging Face 上的下载量已超过 43 万次。
GatorTron? 模型是该网站唯一可用于临床研究的模型,文章的第一作者、来自 UF 医学院健康结果与生物医学信息学系的吴永辉博士说。
"在医疗保健领域,每个人都在谈论这些模型。GatorTron? 和 GatorTronGPT 是独特的人工智能模型,可以为医学研究和医疗保健的许多方面提供动力。然而,它们的建立需要海量数据和强大的计算能力。我们非常感谢英伟达?(NVIDIA®)提供的超级计算机HiPerGator,以探索人工智能在医疗保健领域的潜力。
UF 校友、英伟达?(NVIDIA®)联合创始人 Chris Malachowsky 是 UF 新的 Malachowsky 数据科学与信息技术大厅的命名者。
这座耗资1.5亿美元的建筑由UF和英伟达公司共同出资建造。
2021 年,UF 利用英伟达提供的价值数百万美元的基础设施包将其 HiPerGator 超级计算机升级为精英级,这在大学中尚属首次。
在这项研究中,吴和他的同事们开发了一种大型语言模型,可以让计算机模仿人类的自然语言。
这些模型在标准写作或对话中效果很好,但医疗记录带来了额外的障碍,比如需要保护病人的隐私,而且技术性很强。
数字医疗记录不能在谷歌上搜索,也不能在维基百科上共享。
为了克服这些障碍,研究人员剥离了 UF Health 医疗记录中 200 万名患者的身份信息,同时保留了 820 亿个有用的医学词汇。
他们将这一数据集与另一个包含 1,950 亿个单词的数据集结合起来,训练出 GatorTronGPT 模型,利用 GPT-3 架构(即生成预训练变换器,一种神经网络架构)分析医疗数据。