《期刊如何识别AIGC在论文中的使用,以及当使用被发现后会发生什么?》

  • 来源专题:科技期刊发展智库
  • 编译者: 郭林林
  • 发布时间:2024-02-22
  •   人工智能生成内容(AIGC)和AIGC模型已成为内容创建领域的强大工具。这些人工智能系统旨在以一度难以想象的速度和规模生成文本,包括学术论文。尽管人工智能技术显示出巨大的潜力,但它也引发了许多担忧,尤其是在学术写作的背景下。在这篇文章中,我们将定义AIGC及其模型,探索其在学术界日益增长的用途,讨论围绕作者身份、所有权、创造力、虚假参考文献和偏见的潜在问题,并研究期刊如何检测未公开的AIGC。我们还将讨论未披露AIGC使用的后果,并强调在学术出版中使用人工智能的透明度和伦理的重要性。

      定义AIGC及其模型

      AIGC是指由人工智能系统产生的书面、视觉或听觉材料,通常由高级语言生成模型生成。这些模型是在庞大的数据集上训练的,使它们能够模仿类似人类的语言,并生成广泛主题的内容。近年来,人工智能生成的内容已进入各个领域,包括新闻、营销和学术界。

      在学术领域,AIGC模型被用于起草研究论文、摘要和期刊文章。这些人工智能系统能够生成与人类书写非常相似的文本,这在学术界引起了好奇和警觉。

      学术写作中最常见的问题

      人工智能在学术写作中的日益使用引发了一些担忧。其中包括:

    (1)作者和所有权:当人工智能系统生成内容时,会出现关于合法作者的问题。是程序员、用户还是人工智能本身?谁拥有这些内容,应该如何对其进行归属?

    (2)创造力:人工智能生成的内容往往缺乏人类作者为其作品带来的创造性火花和独特视角。这可能会导致学术写作中个人风格和研究视角的丧失。

    (3)虚假参考文献和偏见:人工智能生成的论文可能引用不存在来源的参考文献或提供有偏见的信息。这对研究的完整性构成了重大风险。

      期刊对AIGC的评价

      大多数学术期刊对人工智能生成器的使用都有严格的政策。虽然这些期刊通常禁止人工智能生成器被列为作者,但它们要求全面披露其使用情况。例如,一些期刊要求使用人工智能技术的作者全面介绍所使用的工具、所使用的方法以及评估生成数据可信度的方法。人工智能的透明使用被认为对保持研究的完整性至关重要。

      如果作者没有在他们的手稿中声明人工智能生成器的使用,期刊就有机制来识别未公开的人工智能生成内容。

      期刊检测AIGC遵循哪些检测方法

      期刊采用各种方法来识别未公开的AIGC,包括:

    (1)同行评审:同行评审可以利用他们的专业知识来发现手稿中不寻常或可疑的写作风格。人工智能生成的内容可能表现出重复句子和不连贯结构等模式。剽窃检测软件也被用于分析文本与已知AIGC的宏级别相似性。

    (2)人工智能文本分类器:使用机器学习算法和自然语言处理技术来分析大量研究文章,包括已知的人工智能文本分类生成的内容。这些算法经过训练,可以识别人工智能生成的文章特有的模式,从而区分人类和人工智能创作的内容。

    (3)元数据分析:检查文章的作者、发表日期和发表期刊的信息。将这些信息与有关AIGC生成内容的已知数据进行比较可以发现相似之处。

    (4)剽窃检测:剽窃检测工具用于将手稿的文本与现有文章进行比较。与已知AIGC高度相似可能表明未公开使用AI生成器。

    (5)无监督机器学习:聚类算法将研究文章分组,这些文章与已知的AIGC生成的内容有相似之处,有助于检测。

    (6)人工审核:人工智能生成可能性高的文章可能会进行人工审核,以确认人工智能检测工具的准确性。

      未声明AIGC的后果

      当学术期刊在手稿中发现未公开的AIGC时,可能会给作者带来不利后果。这种行为被认为是不道德的,并对提交人的诚信造成负面影响。

    (1)伦理影响:学术写作中未声明的AIGC造成了严重的伦理问题,它破坏了诚实、透明和学术诚信的原则。

    (2)对作者声誉的损害:这可能会产生长期的后果,因为信任和可信度在学术界至关重要。学者和同行可能会对这些作者持怀疑态度,他们未来的贡献可能会受到怀疑。

    (3)期刊拒稿:如果在编辑过程或同行评审中发现未公开的AIGC,期刊可能会直接拒绝稿件。

    (4)对期刊可信度的影响:读者和整个学术界都依赖期刊来维护严格的标准,而这方面的任何失误都可能对期刊的声誉产生不利影响。

    (5)法律影响:在极端情况下,未披露的AIGC使用可能会导致法律问题。剽窃和学术不端行为将受到严肃对待,受此类行为影响的机构或个人会追究法律责任。

      人工智能在学术写作中的应用既带来了令人兴奋的机遇,也带来了伦理挑战。AIGC模型有可能加快研究进程,帮助非英语母语者,并改进论文的起草。然而,有道德地使用人工智能生成内容必须是首要任务。透明度至关重要,因此作者必须遵循期刊关于AIGC披露的指南。

相关报告
  • 《为什么期刊要使用预印本?》

    • 来源专题:科技期刊发展智库
    • 编译者:刘敬仪
    • 发布时间:2022-12-29
    •   ASAPbio Fellows 计划收集了公众对预印本的各种看法,并通过采访几位知名期刊的编辑来获取其关于期刊预印本的经验,总结期刊参与预印本的目的和计划。采访对象为Alejandra Clark(PLOS ONE的编辑)、Beth Osia(加利福尼亚City of Hope的博士后,预印本征集团队,曾就职于 Proceedings B ,现就职于 Open Biology )、Mario Mali?ki(Research Integrity and Peer Review的编辑主任)。以下是访谈内容要点:   第一,预印本促进开放科学。编辑们表示预印本为期刊提供了参与和支持开放科学实践的机会,使研究人员能够在他们向期刊投稿之前(或同时)迅速传播他们的最新工作,发布预印本还可以增加论文的关注度和引用率,并为作者提供获得社会反馈的机会。当前PLOS ONE在扩大与预印本服务器的合作伙伴关系,在向Research Integrity 和 Peer Review提交手稿期间,作者可以选择在 Research Square 上发布预印本,并利用 Springer-Nature 的In Review服务公开显示所有评审阶段的实时更新和出版过程。   第二,预印本征集能扩大期刊范围和广度。作者通过预印本发布的前沿研究也为期刊编辑提供了新的机会,编辑可以与作者联系,表达对其预印本的兴趣。   第三,预印本使得编辑对研究生命周期有整体了解。编辑通过预印本可以广泛了解一篇研究论文在期刊发表之前是如何形成和发展的,同时可以观察论文在不同版本中的演变情况,例如预印本和提交给期刊之间有关预注册、伦理监督或作者署名的信息是否发生了变化。   第四,参与预印本有助于培养编辑技能。预印本工作可以使得编辑更好地了解出版过程以及拓宽其知识广度,同时也使得编辑有机会和研究人员进行充分交流,为后续审稿人的选择提供更好的建议。 编译:刘敬仪、杨恒
  • 《有关图书馆应对新冠疫情、资源发现与未来发展的思考》

    • 来源专题:图书情报
    • 编译者:xuxue
    • 发布时间:2020-05-08
    • 最近几个月的公共卫生事件对全世界人民的生活产生了巨大影响。在我所在的牛津大学博德莱安图书馆(the Bodleian Libraries at the University of Oxford),图书馆实体服务已完全停止,没有读者,也没有工作人员被允许进入大楼。图书馆的根本目的是为读者提供信息,放弃图书馆的实体空间和实体馆藏,感觉就像是在图书馆的运营中心撕开一个巨大的缺口。 1、数字资源发现 我为博德莱安图书馆提供资源发现服务,这是现代图书馆中电子化程度最高的部分之一。在很多情况下,纸质资源将以电子版形式提供,但其覆盖范围不完整(尤其是已成为档案的馆藏资源),此外,许可限制和/或版权限制可能使电子资源无法被访问。图书馆管理工作和相关工作人员面临的挑战是,使读者尽可能多地以电子方式查阅资料,同时在资源无法获取时予以说明。正是出于这些目的,发现服务可以提供帮助。 2、“保持牛津阅读” 我们在博德莱安图书馆做了什么工作,可使牛津大学的学者和学生继续进行他们的研究/学习?作为合法的藏书图书馆,博德莱安图书馆拥有大量的馆藏,其中大部分是实体藏书。 博德莱安图书馆拥有数百年的管理纸质藏书的经验,并可将其提供给读者。由于现在图书馆对读者和工作人员均不开放,所有这些都消失了。博德莱安图书馆一直在开展“保持牛津阅读(Keep Oxford Reading)”的活动,旨在提出新的解决方案,使读者能够继续获取尽可能多的资源,并将这些变化及时告知读者。 3、临时数字图书馆 博德莱安图书馆电子图书和论文馆藏的一个重要组成部分,是基于电子资源呈缴制度(the electronic legal deposit,简称ELD)而获得的电子资源,对这部分资源的使用被严格限制。它们是法律框架的一部分,使英国的出版商能够以数字形式存储其出版的图书和期刊。资源只能从博德莱安图书馆内部的计算机终端进行访问,并且一次只允许一位用户访问。自从图书馆闭馆以来,约50万册电子图书和500万篇期刊论文实际上一直无法被访问。对资源访问的限制总是让用户感到困惑,而此次闭馆也促使人们再次呼吁开放ELD馆藏,以便能够正常访问。遗憾的是,作为合法的呈缴制图书馆不能这样做,除非被授予这样做的权利,所以图书馆员所能做的就是向读者道歉。但是,有一种方法可以在不触犯法律的情况下更容易地获取资源。 尽管ELD馆藏不能被公众广泛获取,但是我们的电子资源正在发生巨大变化,因为出版商正将越来越多的馆藏资源临时免费向用户开放。从Jisc与Kortext合作的作品,或者从Ex Libris的临时免费馆藏清单中,可以看出这种慷慨的规模。并非所有新发行的系列都受到普遍欢迎。互联网档案馆(the Internet Archive)已经免费公开了大量图书,但其中许多图书仍在版权范围内,作者对他们不会因作品的使用而获得报酬感到不满。不过,总的来说,这些变化受到读者和图书馆员的欢迎。 4、未来的挑战和数字工具 从图书馆员的角度来看,当现在免费的资源不再可用时,挑战将会出现:有些资源可能需要我们付费订阅,有些可能仍然可以免费使用,但大多数可能需要删除,不仅是从SOLO删除,而且需要从其他位置删除,例如阅读清单。为了更易于识别,在SOLO中对这些电子书进行了区分,阅读清单的编辑将在资源被添加到其中时给出提示。 牛津在线阅读清单(Oxford Reading Lists Online,简称ORLO)是我们Talis Aspire阅读清单服务的对外名称,该服务在2020年2月底之前还没有在大学的每个部门推出。为了帮助那些无法获得实体资源的学生,学校决定允许大学的每个学术部门在图书馆工作人员的支持下将其阅读清单纳入该系统。阅读清单项目的初衷是优先使用有电子副本的资源,但现在图书馆正在做出更多努力,以尽可能多的提供更多文本的电子版本。从博德莱安图书馆的角度来看,一个主要的变化是首次引入了由用户驱动的资源采购方式。 Browzine及其相关工具LibKey和LibKeyNomad被世界上许多大学图书馆使用。虽然Browzine为研究人员提供了一个用来管理期刊阅读的实用工具,但是LibKey是一个将Browzine数据集成到发现系统中的工具,这在当前情况下非常重要,特别是对于具有ELD资源的图书馆来说。使用SOLO中的Libkey,可以看到指向文章下载地址的链接,以及包含DOI或ISSN信息元数据的期刊链接。 5、远程办公 并非所有对图书馆运行方式的改变都是为了帮助读者继续他们的研究或学习。事实证明,对于许多不习惯在家办公的图书馆工作人员而言,远程办公具有挑战性。面临的挑战包括缺乏设备、网络连接速度慢、难以安排与家人和宠物共处的空间,以及对许多人来说,要完成的工作内容发生了重大变化。网上有很多资源可以提供帮助,包括Merrilee Proffitt的这篇指南,但是,如果上网确实是个问题,这些资源提供的帮助将是有限的。 6、新常态 目前尚不清楚新型冠状病毒危机将持续多久。在我撰写本文时,有报道显示今年晚些时候将出现第二个疫情高峰,并且可能会在长达一年的时间内限制社交活动。到目前为止,从政府到小型企业都在继续动用财政储备,而忽略了常规的预算限制。显然,任何组织这样做的能力都是限制的:当剩余现金用完时会发生什么?到那时,很可能图书馆的命运将是我们最不担心的事情。在不那么悲观的情况下,这对图书馆意味着,目前转向电子内容和交付的做法将变得常态化。这是学者和学生共同期望的工作方式,图书馆应该满足这一需求。