《AI 机器人撰写并评审了本次会议的所有论文》

  • 编译者: 程冰
  • 发布时间:2025-11-30
  •        2025年10月22日,计算机领域将迎来首次所有论文和评审均由机器完成的科学会议Agent4Sciense2025活动。届时将展示提交的论文——由人工智能(AI)代理本身或进行实验的人类进行演示——以及由学者组成的小组讨论。

           此次会议的共同组织者、加州斯坦福大学的 AI 研究员 James Zou 表示,会议提供了一个“相对安全的沙盒,我们可以在其中尝试不同的提交流程、不同类型的评审流程”。Zou 说,它旨在捕捉过去一年中 AI 在科学应用方式上发生的“范式转变”。研究人员现在不再使用大型语言模型(LLMs)或其他为特定任务设计的工具,而是构建协调的模型组,即所谓的代理,以充当“在整个研究工作中工作的科学家”。

           AI 模型已被用于生成和评审研究,但大多数出版商和会议组织者禁止机器被列为论文作者或演讲者。邹说:“我们认为我们可以反其道而行之,让作者和评审者都必须是 AI。”根据会议指南,尽管人类可以提供建议和反馈,但 AI 应该是主要贡献者,类似于第一作者。

           计算机科学家 Margaret Mitchell 表示,此次会议提醒人们“我们 AI 领域的人需要更好地理解以这种方式使用系统的优点和缺点”。她在纽约市的 Hugging Face 研究 AI 伦理。她补充说:“如何评估 AI 代理本身就是一个开放的研究领域。”一个关键问题是如何考虑模型产生无用“假阳性”发现的频率——这可能会影响其整体效用。

           Hugging Face 的人工智能研究员克莱门汀·福里尔(Clémentine Fourrier)表示,Agents4Science 还有另一个好处。“希望像这样的会议能分流一些人工智能领域的冗余内容,从而减轻其他会议审稿人的负担,他们说,会议组织者收到了 300 多个人工智能代理提交的作品,其中 48 篇在经过人工智能评审小组评估后被接受。这些论文主要是计算研究(而非涉及物理实验),涵盖了从精神分析到数学的各个领域。他希望这次会议能提供关于人工智能科学家水平及其所犯错误类型的数据。米切尔说,这些数据可用于为研究中人工智能的使用政策提供信息。如果任由人工智能代理自行发挥,它们仍然容易出错。提交给 Agents4Science 会议的论文被要求在过程的每个步骤中说明研究人员与人工智能代理之间的互动。邹说,这意味着将有可能评估人类参与的程度如何影响工作的质量。

           人工智能在评审方面的表现如何也将受到严格审查。为了筛选会议论文以供接受,人工智能代理使用提供给著名 NeurIPS 会议评审员的指南和评分系统进行了第一轮评审。然后,顶尖论文也由人类顾问委员会进行评估。邹说,评审将公开供所有人阅读,组织者还将比较人工智能生成的评审与人类撰写的评审。“我认为那也将提供一个有用的比较基准,”他补充道,将人工智能模型用作期刊或会议的同行评审员是一个有争议的话题。英国物理学会最近的一项调查发现,57%的受访者表示,如果生成式人工智能被用于撰写他们合著稿件的同行评审报告,他们会感到不高兴。人工智能评审员存在一系列弱点和漏洞——例如,一些评审员被发现会遵循隐藏指令对论文给出正面评价——这需要采取保障措施。一些研究人员认为,使用人工智能评审论文可能意味着早期职业研究人员会错过学习关键技能的机会。

           但邹和其他人表示,至少在计算机科学领域,需要某种形式的 AI 评审来应对提交给会议的论文数量的巨大增长。NeurIPS 的投稿量在过去五年中增加了一倍多,部分原因是 LLMs 的使用。邹建议,AI 代理可以与人类组成混合评审团队。“出版物数量激增,我认为人们开始认识到我们确实需要帮助,”他说。

           亚特兰大佐治亚理工学院的计算机科学家马修·冈博莱(Matthew Gombolay)表示,现有研究已经表明,在评估新颖性和重要性方面,LLMs 不如人类。冈博莱也是 2026 年人工智能促进协会会议的伦理联合主席。他认为,比 Agents4Science 更严谨的实验是让一个现有的主要会议随机将论文分配给人类或 LLM 审阅,然后监测哪种审阅方式能带来更具影响力的突破。

相关报告
  • 《WAME 关于与学术出版物相关的 ChatGPT 和聊天机器人的建议》

    • 来源专题:科技期刊发展智库
    • 编译者:郭林林
    • 发布时间:2023-03-31
    • WAME提出关于使用聊天机器人的建议,旨在帮助他们为自己的期刊制定有关聊天机器人的政策,帮助作者了解如何在其成果中使用聊天机器人,并满足所有期刊编辑访问稿件筛选工具的需求。 聊天机器人是一种“在人工智能、自动规则、自然语言处理(NLP)和机器学习(ML)的驱动下,处理数据以响应各种请求”的工具。人工智能(AI)广义上指的是能够以类似人类的方式学习和决策的计算机。近年来,聊天机器人已经被许多公司使用,包括医疗保健公司,用于提供客户服务、路由请求或收集信息。 ChatGPT是最近发布的一款聊天机器人,它“是生成型人工智能的一个例子,因为它可以创建以前从未存在过的全新内容”。在某种意义上,它可以使用新的方式组织现有信息。ChatGPT有很多潜在的用途,包括“例如,总结长篇文章,或制作一份演示文稿的初稿,然后再进行调整。”它可以帮助研究人员、学生和教育工作者产生想法,甚至可以就某一特定主题撰写质量合理的论文。因此,大学不得不改变教学方式。 ChatGPT具有许多限制,正如其创造者承认:“ChatGPT有时会写出看似合理但不正确或荒谬的答案……理想情况下,当用户提供模棱两可的查询时,模型应当提出明确性的问题。相反,我们当前的模型通常会猜测用户的意图……尽管我们努力使模型拒绝不适当的请求,但有时它会对错误的指令做出反应或表现出不恰当行为。“而且,“与谷歌一样,ChatGPT不会在网上搜索当前事件的信息,其知识仅限于2021之前所学的内容,这使得一些答案显得过时。”OpenAI目前正在开发一个改进版本,“比以前的版本更擅长生成文本”,其他几家公司正在创建自己的“生成AI工具”。 聊天机器人使用现有文本库进行“训练”。因此,响应操作员的特定输入(“问题”或“种子文本”),聊天机器人会以“答案”或其他输出做出响应。最终,该输出包括根据算法调整的训练材料的选择。由于聊天机器人没有意识,它们只能重复和重新排列现有的材料。它们的内容中没有新的思想:它们只能是偶然的原创。由于聊天机器人利用了他们接受过培训的现有文本库,因此在某些情况下,他们可能会逐字逐句地重复这些文本,而不会透露其来源。根据最近一份使用ChatGPT生成文本的预印本,“直接从ChatGPT获得的初步文本中正确引用的百分比仅为6%。”,因此,如果聊天机器人的输出内容要在学术期刊上发表,为了避免抄袭,人类作者和编辑必须确保文本包含完全正确的参考文献,其程度与人类作者的要求完全相同。 聊天机器人不是法律实体,也没有法律人格。一个人不能以任何方式起诉、传讯或惩罚聊天机器人。使用软件的公司发布的许可文件中规定了使用条款和使用软件结果的公认责任。此类文档与被其他书写工具(如Word、PowerPoint等)生成的文档类似。正如微软对使用Word编写的任何内容不承担任何责任一样,ChatGPT的创建者OpenAI对使用其产品生成的任何文本不承担任何责任:其使用条款包括赔偿、免责声明,以及责任限制。只有ChatGPT的用户可能会对其所犯的任何错误负责。因此,将ChatGPT列为作者(这已经在发生,甚至被鼓励)可能是错误的,在法律上是不可辩护的。 虽然ChatGPT可能被证明是对研究人员的有用工具,但它对学术期刊构成了威胁,因为ChatGPT生成的文章可能会在已发表的文献中引入虚假或剽窃的内容。同行评审可能无法检测到ChatGPT生成的内容:研究人员很难区分ChatGPT产生的摘要和作者撰写的摘要。那些最了解该工具的人很警惕:一个大型人工智能会议禁止在会议论文中使用ChatGPT和其他人工智能语言工具。 从另一个角度来看,聊天机器人有助于制作欺诈论文;这种行为违背了科学哲学。可能会有人认为,聊天机器人的使用与papermill差别很小——尽管后者显然有欺骗的意图,但对于聊天机器人的应用来说不尽然。然而,人工智能能够帮助生成错误的想法,这一事实本身就不科学,也不可靠,因此编辑们应该感到担忧。 与此相关的是,2022年还发布了DALL-E 2,这是另一个基于ML的系统,可以根据OpenAI提交的自然语言文本描述创建逼真的图像和艺术,OpenAI是制作ChatGPT的同一家公司。最近,谷歌还发布了一款名为Imagen的类似产品。这些工具也引发了与ChatGPT类似的担忧。有趣的是,使用DALL-E2生成的每个图像都在右下角包含一个签名,以说明图像的来源;然而,这个标签可以被网络搜索到的几个简单方法中的一种很容易地删除。 随着ChatGPT和DALL-E2的出现,以及更多工具的出现,编辑们需要制定使用此类技术的期刊政策,并要求工具能够检测其生成的内容。针对作者的学术出版指南应根据不同群体的意见制定,包括第一语言不是英语的研究人员。这可能需要一些时间。同时,我们为编辑和作者提供以下建议。 WAME建议: 1.聊天机器人不能是作者。聊天机器人无法满足成为作者的要求,因为他们无法理解作者的角色或对论文负责。聊天机器人无法满足ICMJE的作者标准,特别是“最终批准将要发布的版本”和“同意对作品的所有方面负责,以确保与作品任何部分的准确性或完整性相关的问题得到适当调查和解决。”聊天机器人无法理解利益冲突声明,或具有签署声明的法律地位。聊天机器人没有独立于其创建者的从属关系。他们不能持有版权。提交手稿的作者必须确保所有被命名为作者的人都符合作者标准,这显然意味着聊天机器人不应被视为作者。 2.当使用聊天机器人时,作者应该是透明的,并提供有关他们如何使用的信息。由于该领域目前发展迅速,使用聊天机器人帮助撰写论文的作者应声明这一事实,并在提交的论文中提供所用聊天机器人的完整技术规范(名称、版本、模型、来源)和应用方法(查询结构、语法)。这与ICMJE关于承认书面协助的建议一致。 3.作者对聊天机器人在其论文中所做的工作(包括所呈现内容的准确性,以及没有抄袭)负责,并对所有来源的适当归属(包括聊天机器人制作的内容)负责。借助聊天机器人撰写文章的人类作者对聊天机器人的贡献和其准确性负责。他们必须能够确定他们的论文包括聊天机器人产生的文本没有抄袭。人类作者必须确保所有引用的材料都有适当的属性,包括完整的引用。他们应该声明聊天机器人使用的特定查询函数。作者需要寻找并引用支持聊天机器人生成的内容来源。由于聊天机器人可能被设计为忽略反对其输出中表达的观点的来源,因此作者有责任查找、审查并在其文章中包含此类观点。 4.编辑需要适当的工具来帮助他们检测人工智能生成或更改的内容,无论他们是否能付费,这些工具都必须可用。许多医学期刊编辑使用20世纪的手稿评估方法,但现在发现自己面对的是21世纪的人工智能创新和行业,包括被篡改的抄袭文本和图像以及papermill生成的文档。他们在试图将合法的与捏造的区分开来时已经处于劣势,像ChatGPT这样的聊天机器人将这一挑战提升到了一个新的水平。编辑需要访问帮助他们高效准确地评估内容的工具。通过STM工作的出版商已经在开发这样的工具。为了科学和公众的利益,无论编辑是否有能力支付这些工具,都应该向他们提供这些工具。通过将其纳入开源出版软件(如公共知识项目的开放期刊系统),以及关于筛选输出的使用和解释的培训,将使自动筛选提交的稿件成为许多编辑翘首以待的现实。
  • 《哈佛大学利用“印刷电路+MEMS”工艺打造微型机器人》

    • 来源专题:集成电路
    • 编译者:shenxiang
    • 发布时间:2020-06-18
    • 受昆虫生物学的启发,哈佛大学的一个团队正在突破其项目的极限,打造出有史以来最小、速度最快的微型机器人:HAMR-JR。 在名为“哈佛移动微型机器人(HAMR)”项目的最新进展中,研究人员表示,他们已经成功地将这个灵感来自蟑螂的机器人缩小到硬币大小。这个名为“HAMR-JR”最新微型机器人虽然还不能爬上水柱,但它可以奔跑、跳跃、携带重物和快速转弯。 HAMR-JR微型机器人是由哈佛大学约翰·A·保尔森工程和应用科学学院(SEAS)和哈佛威斯生物启发工程研究所的研究人员携手开发的,它只有受蟑螂启发的哈佛移动微型机器人HAMR的一半大小。 HAMR-JR只有一便士大小,几乎可以完成它的大型前身的所有壮举,促使它成为迄今为止最灵巧的微型机器人之一。 “这种规模的大多数机器人都相当简单,只展示了基本的移动能力。”Kaushik Jayaram说,他是SEAS and Wyss的前博士后研究员,也是该论文的第一作者。“我们已经证明,你不需要为灵巧妥协或控制大小。” Jayaram目前是科罗拉多大学博尔德分校的助理教授。 这项研究在本周的国际机器人和自动化会议(ICRA 2020)上虚拟会议展示了出来。 这项研究面临的一个大问题是,用于制造HAMR早期版本和其他微型机器人(包括RoboBee)的弹出式制造流程,是否可以用于制造多种规模的机器人——从微型外科机器人到大型工业机器人。 PC-MEMS(印刷电路微机电系统)是一种制造工艺,在这种工艺中,机器人的部件被蚀刻在一张2D的薄片上,然后以3D的形式呈现出来。为了建造HAMR-JR,研究人员只是简单地缩小了机器人的2D平面设计——以及驱动器和车载电路——以重现一个具有所有相同功能的更小的机器人。 Jayaram说:“这次试验的奇妙之处在于,我们不必对之前的设计做任何改变。”“我们可以证明,这一制造过程基本上可以应用于各种尺寸的任何设备。” HAMR-JR体长2.25厘米,重约0.3克,相当于一枚硬币的重量,它奔跑速度惊人,使它不仅是最小的,也是最快的微型机器人之一。 这项研究是由Jennifer Shum, Samantha Castellanos和E. Farrell Helbling共同撰写的。这项研究得到了DARPA和维斯研究所的支持。 对蟑螂的误解 对这位今年加入CU Boulder的工程师Jayaram来说,这个项目是一系列机器人设计中最新的一个,这些机器人的灵感来自一个不太可能的来源:令人厌恶的蟑螂。 Jayaram之前制造了一个名叫CRAM的小型机器人,它可以像城市里的害虫一样挤进看似不可能的空间。他的另一个作品能够头朝下撞到墙上,然后继续跑——就像一只蟑螂一样。 “在上研究生之前,我从来都不喜欢蟑螂。”Jayaram说,“但后来,这么多年来,我觉得,‘是啊,你太恶心了。但作为一种特别的生物,你也是非常有用的,我们可以从中学到东西。’” 设计用来模仿这种讨厌昆虫的速度和机动性的HAMR-JR,也带来了一系列工程上的挑战。 最主要的就是动力问题。这种尺寸的机器人不能使用传统的马达。当它们太小的时候就会过热。因此,哈佛大学的研究小组使用一种叫做“压电致动器”的工具为HAMR-JR提供了动力。 此外,按比例缩小确实会改变一些控制步长和关节刚度的原则,因此研究人员还开发了一个模型,可以根据目标尺寸预测运动指标,如跑步速度、脚力和有效载荷。然后可以使用该模型来设计具有所需规范的系统。 Jayaram解释说,为了制造这么小的机器人,研究人员首先用激光将机器人的身体部分的形状蚀刻在一块碳纤维复合材料上。 Jayaram说:“我们在平面上把所有东西做成二维结构,然后像折纸一样把它折叠起来,做成三维结构。”“在显微镜下观察要花很多时间才能让它工作。” 小小机器人,大有希望 这些让眼睛的疼痛得到了回报:HAMR-JR可以左右转弯,甚至可以向后疾走。它跑步的速度是它身体长度的14倍,也就是大约每秒1英尺。相比之下,哺乳动物世界中速度最快的动物——猎豹的冲刺速度约为每秒16个身长。 HAMR-JR只是一个开始,Jayaram补充道。理论上,工程师们可以用他的团队同样的方法制造出更小的机器人——铅笔橡皮或者更小。 “我们证明了我们的设计和制造方法是高度可扩展的。”Jayaram说,“我们可以把所有东西缩小或放大,机器人仍然可以工作。” 现在,Jayaram想看看他还能从昆虫身上获得什么灵感:他能不能做一个有6条或8条腿的微型机器人来取代HAMR-JR的4条腿?那么,如果一个小机器人足够灵活,即使被踩到也能存活下来呢? 换句话说,当你身边有蟑螂的时候,没有什么是你做不到的。 “我对生物学和工程学边缘的问题感兴趣HAMR-JR”Jayaram说,“什么是生物学能做而工程学不能做的?” 前身——微型机器人HAMR 2018年,哈佛大学在《自然通讯》发表研究,展示了灵感来自蟑螂的微型机器人HAMR,既能在陆地上行走,也能在水面上游泳、在水下行走,只要需要,就可以探索新的环境。作为对比,在自然界中,蟑螂可以在水下存活30分钟,但现在,蟑螂机器人青出于蓝而胜于蓝。 HAMR使用多功能脚垫,依靠表面张力和表面张力诱导浮力,当HAMR需要游泳,也可以施加电压打破水面,当HAMR需要下沉。这一过程被称为电润湿,即在施加的电压下减小材料与水表面的接触角。接触角的变化使得物体更容易突破水面。 研究人员表示,这项研究表明,微型机器人可以利用小规模的物理——在这种情况下表面张力来执行功能和挑战更大的机器人。 HAMR重1.65克(相当于一个大回形针的重量),可以在不下沉的情况下额外携带1.44克的有效载荷,它摆动腿的频率可达10赫兹。上面涂了一层聚二甲苯,防止它在水下短路。 一旦进入水面以下,HAMR就会像在陆地上一样走路,而且移动自如。要回到干燥的陆地,HAMR面临着来自水的巨大挑战。一种相当于机器人重量两倍的水面张力向下压在机器人身上,此外,这种诱导力矩还会大大增加机器人后腿的摩擦力。 研究人员加固了机器人的传动装置,并在机器人的前腿上安装了软垫,以增加负载能力,并在爬升过程中重新分配摩擦力。最后,爬上一个适当的斜坡,机器人就能跳出水面。