2025年2月21日,Evolutionary Scale PBC的Alexander Rives等研究人员在《Science》发表论文“Simulating 500 million years of evolution with a language model”,研究提出了前沿多模态生成语言模型ESM3,可以对蛋白质的序列、结构和功能进行推理。研究促使了ESM3生成荧光蛋白,在合成的世代中发现了一种与已知荧光蛋白相距很远的明亮荧光蛋白,估计这相当于模拟 5 亿年的进化。
这篇文章入选《Science》第387卷第6732期封面文章,封面插图描述了用户在连接到代表语言模型的机器的控制台上排队输入提示。三个大漏斗代表来自蛋白质序列、结构和功能注释的公共数据库的输入。