《Nature | 不坦诚论文中使用ChatGPT会被发现吗?》

  • 来源专题:数智化图书情报
  • 编译者: 于彰淇
  • 发布时间:2023-12-07
  • 2022年11月底,OpenAI发布了一款聊天机器人:ChatGPT。ChatGPT是一种由人工智能(AI)驱动的工具,可以理解和生成类似人类语言习惯的文本。至今为止,它已经升级到了ChatGPT-4架构,可以用文字方式与用户互动,还可以用于处理相对复杂的工作,并且能够通过强化训练不断学习。

    如今,已有研究者利用ChatGPT进行科学论文的撰写,但并不是所有文章都会承认ChatGPT提供的帮助。那么,研究者在论文生成过程里使用ChatGPT,但却不在文章中披露,这一行为会被发现吗?

    一篇论文的构成有两位科学家做过一个尝试:在ChatGPT的帮助下,不到一个小时的时间就发表了一篇研究论文,这篇文章流畅,有见地,并以科学论文的预期结构呈现出来。但在该工具真正有用之前,仍然有许多障碍需要克服。

    研究人员设计了一个软件包,可以自动向ChatGPT提供提示,并基于其响应随着时间的推移不断改进论文。这种自主数据到论文系统,引导聊天机器人完成了一个反映科学过程的分步过程——从最初的数据探索到编写数据分析代码和解释结果,再到撰写精美的手稿。

    为了测试他们的系统,研究人员从美国疾病控制和预防中心的行为风险因素监测系统下载了一个公开的数据集,这是一个与健康相关的电话调查数据库。该数据集包括从25万多人那儿收集到的数据,主要关于其糖尿病状况、水果和蔬菜消费以及身体活动的信息。人工智能聊天机器人ChatGPT一直是制作研究论文的助手。图片来源:Ascannio/Shutterstock

    首先,系统要求ChatGPT编写数据探索代码。在第一次尝试时,聊天机器人生成的数据探索代码充满了错误并且不起作用。但当团队的系统检测到这些错误时,它会自动向ChatGPT发送提示,接着ChatGPT会修复代码。

    接下来,研究人员的这一系统促使ChatGPT制定一个研究目标。ChatGPT建议探索体力活动和饮食如何影响糖尿病风险。然后,研究人员继续要求ChatGPT创建一个数据分析计划和数据分析代码,并根据该代码的输出给出结果。ChatGPT很好地完成了这一任务,并得到结论:多吃水果和蔬菜以及锻炼与降低患糖尿病的风险有关。

    有了结果,系统就进一步指导ChatGPT撰写论文。它打开了两个ChatGPT对话。在其中一个例子中,该工具告诉聊天机器人它是一位科学家,并指示它撰写论文的每个部分。第二个ChatGPT则扮演审阅者的角色,为“科学家”版本的聊天机器人生成的文本提供建设性反馈。

    生成式人工智能工具的一个常见问题是它们倾向于通过编造东西来填补空白,这种现象被称为幻觉。为了帮助解决伪造参考文献的可能性,该团队允许ChatGPT访问文献搜索引擎,以便它可以生成具有正确引用的论文。

    ChatGPT生成了一份清晰的手稿和可靠的数据分析。但这篇论文并不完美。例如,耶路撒冷希伯来大学计算机科学家Tom Hope表示,该研究“解决了文献中的一个空白”——这句话在论文中很常见,但在本例中并不准确。他说,这一发现“不会让任何医学专家感到惊讶”。

    研究人员还担心,此类工具可能会让研究人员更容易从事P-hacking等不诚实行为,即科学家在数据集上测试多个假设,但只报告那些产生显著结果的假设。他补充说,另一个担忧是,使用生成式人工智能工具生成论文的便利性可能会导致期刊充斥着低质量的论文。

    尽管该团队的数据到论文方法展示了如何自主生成论文,但它也是专门设计用于创建论文来解释ChatGPT实现这一目标所采取的步骤,这意味着研究人员可以理解、检查和复制这些方法和研究结果。

    南澳大利亚大学开发人工智能教育技术的Vitomir Kovanovi?表示,研究论文中需要提高人工智能工具的可见度,否则将很难评估研究结果是否正确。“如果制造假论文如此容易,我们将来可能需要做更多的事情。”

    马萨诸塞州剑桥市麻省理工学院和哈佛大学博德研究所的计算生物学家 Shantanu Singh 表示,生成式人工智能工具有潜力通过执行简单但耗时的任务(例如编写摘要和生成代码)来加速研究过程,它们可能用于从数据集生成论文或提出假设。但由于研究人员很难发现幻觉和偏见,Singh 说,“我认为写一整篇论文——至少在可预见的未来——不会有特别好的用途。”

    没有披露AI帮助的手稿,正从同行评审员手中溜走8月9日,《Physica Scripta》杂志发表了一篇论文,旨在发现复杂数学方程的新解。这似乎是真的,但科学侦探Guillaume Cabanac在手稿的第三页上发现了一个奇怪的短语:“Regenerate response”。

    该短语是ChatGPT上按钮的标签。法国图卢兹大学的计算机科学家Cabanac立即在PubPeer(科学家们讨论已发表研究的网站)上发布了相关页面的屏幕截图。一些研究人员正在使用ChatGPT撰写论文,但没有透露它。图片来源:Jonathan Raa/NurPhoto via Getty

    英国布里斯托尔《Physica Scripta》出版商IOP Publishing的同行评审和研究诚信负责人Kim Eggleton表示,作者后来向期刊证实,他们使用ChatGPT来帮助起草手稿。在两个月的同行评审(论文于5月提交,修改版于7月发送)或排版过程中并未发现异常情况。出版商现已决定撤回该论文,因为作者在提交时没有声明他们使用了该工具。

    “这违反了我们的道德政策,”Eggleton说。伊斯坦布尔比鲁尼大学和贝鲁特黎巴嫩美国大学联合任职的Abdullahi Yusuf是通讯作者,但目前还没有回应《Nature》杂志的置评请求。

    “冰山一角”这并不是ChatGPT协助的手稿未经声明就溜进同行评审期刊的唯一案例。

    自4月以来,Cabanac标记了十几篇包含泄露ChatGPT短语“重新生成响应”或“作为人工智能语言模型,我……”的期刊文章,并将它们发布在PubPeer上。今年早些时候,ChatGPT的“重新生成响应”按钮在工具更新中更改为“重新生成”。

    包括Elsevier和Springer Nature在内的许多出版商都表示,作者可以使用ChatGPT和其他大型语言模型(LLM)工具来帮助他们制作稿件,只要他们声明即可。(《Nature》杂志的新闻团队在编辑上独立于其出版商Springer Nature。)

    搜索关键短语只会发现ChatGPT的原始而未声明的标记,其中作者忘记编辑掉明显的迹象。因此,使用未公开使用了ChatGPT的文章可能要多得多。“这只是冰山一角,”Cabanac说。

    Cabanac在Elsevier期刊上发表的一些论文中检测到了典型的ChatGPT短语。最新的一篇论文于8月3日发表在《Resources Policy》上,探讨了电子商务对发展中国家化石燃料效率的影响。Cabanac注意到论文中的一些方程没有意义,但在表格上方的话语暴露出了真相:“请注意,作为人工智能语言模型,我无法生成特定的表格或进行测试……”

    Elsevier发言人告诉《Nature》杂志,出版商“意识到了这个问题”并正在调查。该论文的作者分别来自中国沈阳的辽宁大学和北京的中国国际贸易经济合作研究院,他们没有回应《Nature》杂志的置评请求。

    令人毛骨悚然的流畅性论文全部或部分由计算机软件撰写,但作者没有披露这一事实,并不是什么新鲜事。

    然而,总部位于伦敦的英国研究诚信办公室的研究诚信经理Matt Hodgkinson表示,它们通常包含微妙但可检测的痕迹,例如特定的语言模式或误译的“折磨短语”,这些痕迹将它们与人类书写的对应物区分开来。但Hodgkinson表示,如果研究人员删除了ChatGPT样板短语,那么更复杂的聊天机器人的流畅文本“几乎不可能”被发现。“这本质上是一场军备竞赛,”他说,“骗子与试图将他们拒之门外者之间的较量”。

    Cabanac和其他人还在同行评审的会议论文和预印本(未经同行评审的手稿)中发现了ChatGPT的未公开使用。当这些问题在PubPeer上提出时,作者有时承认他们使用了ChatGPT来帮助创作。

    加利福尼亚州旧金山的微生物学家兼独立研究诚信顾问Elisabeth Bik表示,ChatGPT和其他生成性人工智能工具的迅速崛起将为论文工厂提供燃料——这些公司为希望提高出版产量的研究人员制作和销售假手稿。“这将使问题变得更糟一百倍,” Bik说,“我非常担心,已经涌入了大量我们甚至不再认识的论文。”

    极限拉扯期刊中未公开的法学硕士论文问题指出了一个更深层次的问题:时间紧张的同行评审员通常没有足够时长来彻底检查稿件是否存在危险信号。David Bimler以笔名Smut Clyde发现了假论文。“整个科学生态系统要么出版,要么灭亡,”前新西兰北帕默斯顿梅西大学的退休心理学家Bimler说,“看门人的数量跟不上。”

    Hodgkinson表示,ChatGPT和其他LLMs倾向于吐出虚假参考文献,这可能是同行评审员寻找手稿中使用这些工具的一个信号。“如果参考文献不存在,那就是一个危险信号,”他说。例如,Retraction Watch网站报道了使用ChatGPT编写的有关千足虫的预印本;该作品引用的一位研究人员发现了它,并注意到其引用是假的。

    哥本哈根国家血清研究所的微生物学家Rune Stensvold遇到了虚假参考文献的问题,当时一名学生向他索要一篇论文的副本,ChatGPT说是Stensvold在2006年与他的一位同事共同撰写的。但实际上根本不存在这篇论文。然后,当该学生要求人工智能聊天机器人推荐有关芽囊菌(一种肠道寄生虫属)的论文,聊天机器人却拼凑了一篇假的、带有Stensvold名字的参考文献。“它看起来很真实,” Stensvold说,“它告诉我,当我要审阅论文时,我可能应该首先查看参考文献部分。”

  • 原文来源:https://www.nature.com/articles/d41586-023-02477-whttps://www.nature.com/articles/d41586-023-02218-z
相关报告
  • 《Nature论文解读!揭示在南非发现令人担忧的新冠病毒变体》

    • 来源专题:生物安全知识资源中心 | 领域情报网
    • 编译者:hujm
    • 发布时间:2021-03-20
    • 冠状病毒SARS-CoV-2变体出现在世界不同地区,其中的许多变体以惊人的速度传播。在一项新的研究中,一个国际研究小组在南非鉴定出一种传染性的SARS-CoV-2变体(下称SA变体)。相关研究结果近期发表在Nature期刊上,论文标题为“Emergence of a SARS-CoV-2 variant of concern with mutations in spike glycoprotein”。 论文共同作者、美国加州大学河滨分校医学院生物医学科学教授Adam Godzik说,“这些新的COVID-19变体是下一个新的前沿。其中,SA毒株和巴西毒株最令人担忧。它们的突变使它们对我们用现有疫苗产生的抗体产生抵抗性。人们普遍认为,我们正处于一场激烈的竞赛中:除非我们迅速给人们接种疫苗,并消灭这种流行病,否则新的变体将占据主导地位,以至于我们所有的COVID -19疫苗都将无效。” Godzik和两年前加入他的实验室的博士后研究员Arghavan Alisoltani-Dehkordi通过使用计算机模拟提供这种SA变体的刺突蛋白结构来帮助描述它。 Alisoltani-Dehkordi提到,南非夸祖鲁-纳塔尔大学和开普敦大学的研究团队从2020年10月15日至11月25日期间在南非三个省份收集的样本中发现了这种SARS-CoV-2的新谱系或变体,即SA变体。到2020年11月初,这种SA变体迅速成为来自其中两个省份的样本中的主导变体。 Alisoltani-Dehkordi说,“每种SARS-CoV-2变体都有特定的突变。Godzik教授和我利用计算机建模,提出了SA谱系中刺突蛋白突变的可能结构后果和功能后果。我们的分析,也得到了其他几个研究小组的证实,表明其中的一些突变可能导致这种病毒的更高传播性和较弱的免疫反应。” 至少有40个国家发现了这种SA变体,包括美国。Godzik说,“这种变体很可能在尚未测序的地区传播,因此尚未识别到。在美国,测序仍然是一个缓慢的过程。在该国的许多地区,包括加州的河滨市,我们没有任何关于这种变体的信息。” 对SA变体的初步研究表明,它可能对抗体产生抵抗性,这可能会降低疫苗的功效。Godzik说,“这时它受到了高度的关注。随后的研究证实它对疫苗有抵抗性,并且正在蔓延。不过,南非在通过隔离和其他措施控制这种变体方面做得很好。” 英国、南非、巴西和美国加州新出现的所有值得关注的SARS-CoV-2变体都显示出共同的突变特征。但这些变体中的每种也都有一套独特的突变。例如,SA变体和巴西变体分别在刺突蛋白K417N和E484K上有两个独特的突变。 Alisoltani-Dehkordi说,“我们的初步研究结果表明,一些刺突蛋白突变可能与SA变体的传播性增加有关。然而,在这种新的谱系中,刺突蛋白编码基因和其他基因组突变的全部意义还有待确定。需要强调的是,我们并没有足够的证据证实SA谱系与其他谱系相比有更高的疾病进展、严重性或死亡率。但与野生型相比,SA谱系和其他新近出现的谱系具有较高的传播性和不同寻常的分化性,这对SARS-CoV-2毒株的系统监测和在转为疫情暴发之前的变体早期发现提出了很高的要求。” Godzik解释说,不存在单一的COVID-19病毒。相反,存在一个不断进化的病毒群体。变体也会不断进化,获得突变,随时可能发生病毒逃逸。 他说,“很难说只有一种SA变体。理解这一点的一种方法是想象这种变体是一棵树的主要分支,该树有许多较小的分支。其中一些较小的分支可能比其他分支生长得更快,承担更多的重要性。这个动态过程很难预测。” Godzik预测COVID-19将成为我们生活中的常客,就像流感一样。他说,“开发一种流感疫苗需要六个月的时间。模型可以预测流感病毒的进化,疫苗在变体出现之前就会被生产出来。如果预测良好,疫苗就会发挥作用。如果预测出错了,一个沉重的流感季节就会随之而来。这就是COVID-19可能的表现。将会投入大量精力来预测下一年会发生什么,疫苗就会被更新,人们将需要强化疫苗注射。”
  • 《研究发现电场可以产生弧线球》

    • 来源专题:纳米科技
    • 编译者:郭文姣
    • 发布时间:2020-05-28
    • 这一发现是基于电动力学的现象,即马格努斯效应。Zachary Sherman PhD ' 19,他现在是德克萨斯大学奥斯汀分校的博士后,麻省理工学院化学工程教授James Swan在本周发表于《物理评论快报》的一篇论文中描述了这一新现象。 马格努斯效应使旋转的物体被拉向垂直于其运动的方向,如在曲球中;它以空气动力为基础,在宏观尺度下运作——也就是在容易看到的物体上——而不是在更小的粒子上。这种由电场引起的新现象可以将粒子推进到纳米级别,使它们在一个可控的方向上移动,而不需要任何接触或移动部件。 这一发现令人惊讶,因为谢尔曼当时正在测试一些新的模拟软件,以模拟他正在开发的微型纳米粒子在磁场和电场中的相互作用。他所研究的试验案例包括将带电粒子置于电解液中,电解液是一种含有离子或带电原子或分子的液体。 他说,人们已经知道,当直径只有几十到几百纳米的带电粒子被置于这种液体中时,它们会保持悬浮在液体中,而不是沉降,形成胶体。然后离子聚集在粒子周围。新软件成功地模拟了这种离子聚类。接下来,他模拟了穿过材料的电场。这可能会引发一种称为电泳的过程,它将推动粒子沿着应用场的方向前进。软件再次正确地模拟了这个过程。 然后谢尔曼决定进一步推进,逐渐增加电场的强度。“但后来我们看到了一件有趣的事情,”他说。“如果电场足够强,你就能得到正常的电泳,但胶体会自发地开始旋转。”这就是马格努斯效应发挥作用的地方。 他说,在模拟中,不仅粒子在移动过程中旋转,而且“这两个运动耦合在一起,旋转的粒子就会偏离轨道”。“这有点奇怪,因为你向一个方向施加一个力,然后物体就会向你指定的方向垂直(直角)移动。他说,这与旋转球的空气动力学原理直接类似。“如果你在棒球中投掷一个曲球,它会朝着你投掷的方向前进,但随后它也会转向。所以这是著名的宏观马格努斯效应的微观版本。” 当电场足够强时,带电粒子在垂直于电场的方向上产生了强烈的运动。他说,这可能是有用的,因为有了电泳,“粒子会向其中一个电极移动,你会遇到这个问题,粒子会移动,然后它会进入电极,它会停止移动。”所以仅靠电泳是不能产生连续运动的。” 相反,由于这种新效应与应用领域成直角,它可以用来推动粒子沿微通道,只需在顶部和底部放置电极。他说,这样一来,粒子就会“沿着通道移动,永远不会撞上电极。”他说,这使得它“实际上是一种更有效地引导微观粒子运动的方法”。 他说,有两种不同类型的过程可以让这种能力派上用场。一种方法是使用粒子将某种“货物”运送到特定的地点。例如,微粒可以附着在治疗药物上,“你试图把它送到需要药物的目标位置,但你不能直接把药物送到那里,”他说。或者粒子可能含有某种化学反应物或催化剂,需要被引导到特定的通道以进行所需的反应。 另一个例子与这个过程相反:拿起一些目标材料,把它带回来。例如,产生一种产品的化学反应也可能产生许多不需要的副产品。“所以你需要一种方法来推出产品,”他说。这些粒子可以用来捕获产品,然后使用应用的电场提取。“在这种情况下,它们就像小吸尘器一样,”他说。“他们拿起你想要的东西,然后你可以把它们搬到其他地方,然后在更容易收集的地方发布产品。” 他说,这种效应应该适用于各种颗粒大小和颗粒材料,研究小组将继续研究不同的材料特性如何影响这种效应的旋转速度或平移速度。只要粒子和悬浮其中的液体的电学性质(称为介电常数)不同,这一基本现象几乎适用于它们的任何材料组合。 研究人员观察了介电常数非常高的材料,比如金属粒子,悬浮在低导电性的电解液中,比如水或油。谢尔曼说,在介电常数方面,“但你也可以在任何两种有对比的材料上看到这一点”,例如,在两种不混合的油中,就会形成悬浮的液滴。 这项工作得到了NASA和美国国家科学基金会的支持。