该研究还显示,谷歌的聊天机器人 Bard 在某些方面表现优于练习生,Microsoft 的 Bing 聊天机器人的表现与练习生一样好。
研究表明,这些大型语言模型 (LLM) 可用于支持实习医生、护士和全科医生更快地对患者进行分类并缓解卫生服务的压力。
该研究由爱丁堡皇家儿童和青少年医院儿科肺病学顾问、英国爱丁堡大学名誉高级临床讲师 Manjith Narayanan 博士提出。他说:“像 ChatGPT 这样的大型语言模型在过去一年半中变得突出,它们似乎能够理解自然语言并提供可以充分模拟类似人类对话的响应。这些工具在医学上有几个潜在的应用。我进行这项研究的动机是评估 LLM 在现实生活中帮助临床医生的能力。
为了研究这一点,Narayanan 博士使用了儿科呼吸医学中经常出现的临床场景。这些病例由其他六位儿科呼吸医学专家提供,涵盖囊性纤维化、哮喘、睡眠呼吸障碍、呼吸困难和胸部感染等主题。这些都是没有明显诊断的情况,也没有已发表的证据、指南或专家共识指向特定的诊断或计划。