我刚刚第一次使用 ChatGPT。起初,我对自己的未来感到担忧,因为聊天机器人几乎是即时回答了我对自己领域——遗传学——中越来越晦涩难懂的术语的咨询。不过,搞定这个人工智能工具只花了大约 10 分钟。
ChatGPT 于 2022年11月30 日由 OpenAI/微软发布。“Chat Generative Pre-trained Transformer ”有点像打了类固醇的谷歌(Google)。但在短暂的接触之后,我不禁怀疑它是否能处理人类思维的细微差别、语境、幽默和创造力。它能取代我成为教科书作者吗?
我的职业生涯
我撰写生命科学书籍已经有很长一段时间了。我最喜欢的一直是《人类遗传学:概念与应用》,第一版于 1994 年出版,正值人类基因组测序时代的黎明。本周,麦格劳-希尔公司(McGraw-Hill)出版了第 14 版。一次修订需要两年时间,其中一年用于更新内容和处理审稿人的建议,另一年用于 "制作",从校对到最终定稿。然后,休息一年。
随着遗传学演变为基因组学,人工智能介入其中,将比较基因组学的组合信息分层到 DNA 序列上。在数据集上进行训练,然后搜索模式,可用于推断描述物种关系的进化树、祖先测试和鉴证,以及识别癌症扩散时出现的突变序列。
ChatGPT 最近才推出,我还没有在修订新版图书时使用过,但我现在很好奇。我可以想象它输出定义的样子,但教科书远不止“内容”这么简单。人类作者增加了视角、经验,也许还增加了知识,这些都是 ChatGPT 可以从互联网上提取的。
遗传学教科书与生成式人工智能
遗传学研究可以展开和提取成堆的信息、数百万甚至数十亿的数据点。在已知致病基因的 DNA 序列上训练算法,然后在其他个体的细胞中搜索相同或高度相似的序列,以协助诊断。
这种可以改写教科书的人工智能被称为生成式(GPT中的G)。它可以学习“训练”数据的模式和结构,并生成类似的新数据组合,生成文本、图像或其他媒体。
那么 ChatGPT 能写出像我这样的教科书吗?我不这么认为。
我可以想象,生成式人工智能可以写出类似流行作家科琳-胡佛(Colleen Hoover)的小说。事实上,很久以前,我曾在《Playgirl》上发表过一篇奇幻作品,当时我列举了类似文章中的单词和短语,并创造了一个全新的场景。故事涉及印第安纳州乡村的一场龙卷风和一辆手推车。
就像科琳-胡佛的小说和《Playgirl》的幻想一样,教科书也具有非常独特的风格。但教科书的内容远不止每章的单一叙述。在编写过程中,还需要选择照片、设计插图、制作教学工具——问题、摘要、参考资料、盒装阅读材料。下面是教科书出版的简史,然后是我认为人工智能可能无法像人类作者那样出色完成的工作。
生命科学教科书的演变
我的第一本教科书《生命》是生物学入门教材,与凯斯-理查兹(Keith Richards)的同名自传并不相称。那时,销售代表们为了提高市场占有率,可谓是 “全副武装”——试题库、教师手册、案例练习册。如今,情况大不相同!电子教科书嵌入了“自适应学习” 的多项选择题。学习者(曾被称为学生)会收到即时反馈,了解每个错误选项的原因。
每个版本都有新的字体、设计元素和调色板,以使新版本显得与众不同,因为有些主题——有丝分裂、孟德尔、DNA——是不会改变的。大部头书被拆分成更短的版本,就像崩解的冰山一样。
最早的电子书可以追溯到 20 世纪 90 年代。现在,大学学费中包含了电子教科书的限时授权费。“E”也可以代表“昙花一现”(ephemeral)。
在我的第14版新书中,一家公司用“DEI”(多样性、公平性和包容性)的视角仔细检查了我所写的一切。我在这里讲述了发现自己失误的经过。
由于传统教科书价格昂贵,偶尔也会出现人们试图取代传统教科书的努力。但是,根据网上材料或讲义和试题拼凑出一门课程所花费的时间和精力,可能比大多数潜在作者能意识到的要多得多。而且,几年前出现的免费在线教科书缺乏学术出版商所提供的编辑和审稿人审查。
编写教科书的一项不太明显的技巧是与生俱来的写作天赋。风格的要素是微妙的。有多少学者或 ChatGPT 会将被动语态改为主动语态?改写以省略“there are”和其他冗余?避免过度用词?改变句子和段落的长度?将材料组织成符合逻辑的 A、B 和 C 标题?
人工智能能否模仿人类的创造力?
人工智能可以快速组装一个列出 DNA 复制酶的表格或编制技术时间表。但是,训练有素的算法如何模仿作者对例子的选择,或根据对遗传疾病患者的亲身访谈编写案例研究?
人工智能会改进我的干细胞比喻吗?
“干细胞和祖细胞之间的区别,就好比大学新生在选择专业时会考虑很多专业,而大三学生在选择课程时则会更加专注。对细胞进行重新编程就好比大四学生决定转专业。法语专业的学生如果想成为工程师,就必须从头开始,选修完全不同的课程。但是,生物专业的学生想成为化学专业的学生,就不需要从头开始,因为这两个专业有许多相同的课程。干细胞也是如此。”
那么教学法呢?人工智能可以重现填空题或选择题。但它能创造出我的批判性思维练习,即三种SARS-CoV-2变体的维恩图,其中有一些共同的突变吗?我要求读者运用遗传密码规则来预测哪些变化最有可能威胁公众健康。
我试图让我的问题变得有趣。
ChatGPT 会根据《星际迷航》中铁蒺藜的毛发遗传情况提出章末问题吗?追踪《综合医院》中一个家族的罕见血型?为SORAS(肥皂剧快速衰老综合症)——《青春无敌》(The Young and the Restless)中纽曼家族的一种病症——建立血统?
在“进化”一章中继续借用科幻小说,要求学习者找出这些主题所说明的原理:
在尼尔-史蒂芬森(Neal Stephenson)的《七十年代》(Seveneves)中,月球破碎了。两年后,碎片将撞向地球,使地球数百年无法居住。一些已经生活在巨大空间站上的人幸存下来,其他人被选中加入他们的行列。其他人则死于月球垃圾和高温的袭击。在太空中的 "云端方舟 "上,人类的数量不断减少,但最终在辅助生殖技术的帮助下,由七名幸存的女性重新孕育出婴儿。月球炸毁五千年后,准备居住在痊愈的地球上的人类数量已经恢复到 30 亿。(人口瓶颈)
在《被诅咒的孩子》中,一个小镇上的所有女性都突然被来自另一个星球的基因相同的生物所受孕。(非随机交配)
在迪恩-昆齐(Dean Koontzi)的《夺取》(The Taking)一书中,巨大的变异真菌几乎杀死了所有人,只有年幼的孩子和少数保护他们的成年人幸免于难。人类必须从幸存者中重建自己。(创始人效应)
那么历史呢?人工智能可能很容易组合出年表。但它会将 1961 年马歇尔-尼伦伯格和海因里希-马特萨伊在“历史一瞥”盒装读物中破译遗传密码与卡塔林-卡里科和德鲁-魏斯曼发明第一种基于 mRNA 的疫苗结合起来吗?
最后,人工智能能否使用幽默?它是否能在章节末尾提出这样一个关于法医 DNA 检测的问题:
主人在垃圾桶里发现了猫鲁弗斯,它的身上布满了伤口和咬痕,爪子上还粘着一些灰色的皮毛,这些灰色的皮毛很像隔壁那只巨大猎犬“杀手”的皮毛。
ChatGPT 重磅登场
测试 ChatGPT 非常简单。
它在返回晦涩的专业术语定义方面获得了 A+,如四色性(第四种锥状细胞增强的色觉)和染色体破碎(染色体破碎)。
ChatGPT 准确地区分了基因治疗和基因编辑。该工具并没有将基因治疗过度简化为“替换”基因,而是返回“基因治疗涉及将新的或修改过的基因导入人体细胞,以纠正或替换有问题的基因或提供治疗功能”。这个定义涵盖了所有基础。
我的新版教科书有一个方框阅读,介绍流感和 COVID 背后的病毒有何不同。同样,ChatGPT 返回的关于这两种病原体的信息比我想知道的还要多,既有比较也有对比。我可以想象学生会在作业中使用这个回答——我很高兴我的教授生涯已经结束了!
ChatGPT 明确区分了癌症中的驱动基因突变和乘客基因突变,尽管我的教科书定义是从上下文开始的:“驾驶员将车开到目的地;乘客则是顺路”。
ChatGPT 的免责声明写道:“虽然我们有保障措施,但 ChatGPT 可能会向您提供不准确的信息”。显然,它也有疏漏的时候,当我向它询问我写过的其他东西时,我发现了这一点:如何制作一个不可能的汉堡(Impossible Burger)。不仅仅是配料,还有这项杰出发明背后的生物技术。
ChatGPT 的解释开头足够准确:
“不可能汉堡是一种基于植物的汉堡肉饼,旨在模仿传统牛肉汉堡的味道和口感。虽然我无法获得 Impossible Foods 公司使用的确切配方或工艺,但我可以大致介绍一下像 Impossible Burger 这样的植物汉堡通常是如何制作的”。然后,它列出了制作超市中传统素食汉堡主题变体的一般步骤。但“不可能汉堡”与其他汉堡完全不同!
尽管第一人称的回答具有人性化的效果,但这还不够好。
ChatGPT 显然没有读过我 2019 年 5 月在 DNA Science 上发表的文章《剖析不可能的汉堡》(Anatomy of an Impossible Burger)。这是我能想到的最直截了当的标题了。
我的资料来源?专利商标局数据库!只花了几分钟的搜索时间。该专利申请长达 52 页,是在多年的公开研究之后于 2017 年提交的。其中包括数以百计的相关专利和出版物,许多是在主流媒体上发表的。ChatGPT 找不到?
该工具无法获得确切的配方或工艺?这种方法从基因上改变了酵母细胞,使其产生大豆版本的血红蛋白,称为“腿血红蛋白”(leghemoglobin),这种血红蛋白赋予了死牛肉的“口感”和外观。
我不仅于 2019 年在博客上写过“不可能的汉堡”,三年前还在我的教科书第13版中发表过一个版本!
不过,我对在 ChatGPT 雷达下飞行感到欣慰,而不是羞辱,因为很高兴知道我的技能组合还没有过时。虽然我在输入 ChatGPT 时遇到了问题。在早先的草稿中,我反复把它打成 GTP,也许是 DNA 核苷酸 GTP(三磷酸鸟苷)的意思。