《期刊如何检测论文中的AI生成文本?使用AI工具的要注意了》

  • 来源专题:数智化图书情报
  • 编译者: 于彰淇
  • 发布时间:2023-12-21
  • 人工智能生成内容(Artificial intelligence-generated content, AIGC)和 AIGC 模型已成为内容创作领域的强大工具。这些人工智能系统旨在以超乎想象的速度和规模生成文本,包括学术论文。虽然人工智能技术显示出了巨大的潜力,但它也引发了一系列问题,尤其是在学术写作方面。



    在本文中,我们将定义 AIGC 及其模型,探讨其在学术界日益广泛的应用,及其引发的问题,并讨论期刊如何检测未披露的AIGC。此外,还会讨论未披露 AIGC 使用情况的后果,并强调学术出版中使用人工智能的透明度和道德的重要性。



    1AIGC的定义及其模型


    AIGC 是指人工智能系统制作的书面、视觉或听觉材料,通常由先进的语言生成模型驱动。这些模型进过了大量数据集的训练,能够模仿人类语言,生成各种主题的内容。近年来,人工智能生成的内容已进入新闻、营销和学术等各个领域。



    在学术领域,AIGC 模型被用来起草研究论文、摘要和期刊文章,这些人工智能系统能够生成近似人类写作的文本。



    2AIGC在学术写作中的常见问题


    在学术写作中越来越多地使用人工智能引起了一些关注。这些问题包括:



    a. 作者身份和所有权:当人工智能系统生成内容时,就会产生作者归属的问题。是程序员、用户还是人工智能本身?内容归谁所有?



    b. 创造性:人工智能生成的内容往往缺乏人类作者为其作品带来的创造性火花和独特视角。这可能会导致学术写作中个人风格和研究视角的缺失。



    c. 虚假参考文献和偏见:人工智能生成的论文可能会引用不存在的资料来源或提供有偏见的信息。这对研究的完整性构成重大风险。



    3期刊对使用AIGC的规定


    大多数学术期刊对人工智能生成器的使用都有严格的规定。虽然这些期刊通常禁止将人工智能生成器列为作者,但它们要求全面披露其使用情况。例如,有些期刊要求使用人工智能技术的作者全面介绍所使用的工具、方法以及评估所生成数据可信度的手段。透明地使用人工智能被认为是保持研究完整性的关键。




    如果作者没有在稿件中声明使用了人工智能生成工具,期刊会设立机制来识别未披露的AI工具。




    4期刊采用哪些方法检测AIGC?


    1. 同行评审:审稿人可以利用他们的专业知识发现稿件中不寻常或可疑的写作风格。人工智能生成的内容可能表现出句子重复和结构不连贯等模式。查重检测软件也可用于分析文本与已知 AIGC 的宏观相似性。



    2. AI文本识别工具(AI Text Classifiers):机器学习算法和自然语言处理技术用于分析大量研究文章,包括已知的 AIGC 生成的内容。这些算法经过训练,可以识别人工智能生成的文章所特有的独特模式,从而区分人类和人工智能撰写的内容。



    3. 元数据分析(Metadata Analysis):对文章的作者、发表日期和发表期刊等进行检查。将这些信息与 AIGC 生成的内容进行比较,可以发现相似之处。



    4. 查重检查:查重工具将稿件文本与现有文章进行比较。与已知 AIGC 的高度相似性可能表明使用了AI生成器。



    5.  无监督机器学习:聚类算法把与 AIGC 生成内容相似的研究文章进行分组,帮助检测。



    6.  人工审核:使用 AI生成工具可能性较高的文章可能会经过人工审核,确保AI检测工具的准确性。




    5未披露AIGC使用情况的后果


    如果学术期刊发现稿件中使用了AIGC,但是论文中没有说明,可能会给作者带来不利后果。这种行为被认为是不道德的,会对作者的诚信造成不良影响。



    1. 伦理影响:学术写作中未披露 AIGC 会引发严重的伦理问题。它破坏了诚实、透明和学术诚信的原则。



    2. 损害作者声誉:这可能会造成长期的后果,因为诚信和信誉在学术界至关重要,学者和同事可能会对这类作者产生怀疑,他们今后的贡献也可能会受到质疑。



    3. 期刊拒稿:如果在编辑审核或同行评审过程中发现未披露AIGC,期刊可能会直接拒稿。



    4. 对期刊公信力的影响:读者和整个学术界都依赖期刊坚持严格的标准,这方面的任何疏忽都会对期刊的声誉造成不利影响。



    5. 法律影响:在极端情况下,未披露AIGC 使用情况可能会导致法律后果。抄袭和学术不端行为会受到严肃处理,受此类行为影响的机构或个人可能会追究法律责任。

  • 原文来源:https://mp.weixin.qq.com/s/Rt0F8AgxdeMxwBb78W4Akw
相关报告
  • 《用AI修改论文可行吗?三大注意点助你不“踩坑”》

    • 来源专题:数智化图书情报
    • 编译者:于彰淇
    • 发布时间:2023-12-01
    • 现阶段,生成式人工智能(generative artificial intelligence,下文简称AI)悄然在各行各业带来或多或少的影响,这其中也包括科学研究和学术写作。部分研究者已开始尝试让AI工具参与学术写作过程,优化论文并提高写作质量。AI可以在识别语法错误等方面助力写作1,但这不意味着研究者可以完全依赖AI来润色论文,作者的人工检查或审阅是必不可少的。 在使用AI协助学术写作的过程中,作者需要特别留意语境分析、表达准确度、文化敏感性及学术伦理等方面,避免在论文写作中使用AI时常见的一些问题。今天,我们将分别讨论AI使用中的一些注意点,一起来看看吧! 01分析语境 把握细微差别 举一个简单的例子:“While the researcher introduced the participants the sample images appeared one by one on the screen.” 这句话单独拿出来看,由于缺乏语境而且没有标点,容易产生歧义,进而误导读者。 如果断句在images后面,则意思是:“当研究人员向参与者介绍样本图片时,一张张图片出现在屏幕上。” “While the researcher introduced the participants to the sample images, the latter appeared one by one on the screen.” 如果断句在participants后面,则意思是:“当研究人员介绍参与者时,一张张样本图片出现在屏幕上。” “While the researcher introduced the participants, the sample images appeared one by one on the screen.” 究竟要怎么断句才能准确反映出写作者的本意,这需要审核者英文达到母语程度,并具备扎实的学术写作经验。而AI的训练样本往往来源广泛,而非针对特定学科学术写作的特别积累。在充分理解上下文语境的基础上,才能对不同表达的细微差别有清晰的判断。另外,用词的精准度往往会影响研究结果的表达效果,严谨的表达可以帮助避免结论被夸大或淡化。 因此,AI润色后,文章需要人工的逐句二次检查,结合上下文语境理解与判断,将专业且复杂的概念言简意赅地呈现出来。 02保持敏感度 避免用词失误 AI基于大数据进行学习,而大量训练材料往往并没有经过严格全面的人工检查。因此,AI在涉及性别、种族和文化等方面的内容上可能会有存在偏见2-3或不恰当的表达。为了避免这种失误,论文仍需通过人工仔细审核甄别,以避免在文化等方面的错误表述。 03充分披露 严守学术伦理 近来,存在部分媒体利用AI生成新闻4,并在发布后被质疑剽窃的情况。对于严肃、严格的学术写作来说,对AI的使用则应更为谨慎。学术论文对独创性尤为重视,如果缺乏原创的见解,则很有可能增加拒稿几率5。然而,现阶段AI较难全部识别出剽窃或侵犯版权的部分,因而有可能产出存在错误或容易误导读者的内容。 同时,作者们也需要了解到,未发表的论文上传到AI进行润色时,有可能成为训练语料的一部分。因此,使用AI进行文章修改或翻译前需要审慎的考虑。 作者在使用AI帮助论文写作的时候,除了需要对文章内容和遣词造句进行把控之外,还应注意充分、正确地披露和声明AI使用的情况。另外,由于AI无法对论文中的错误负责,作者对文章负有全部责任6,因而人工审阅十分重要,必不可少。 近年来,AI技术变得越来越先进,应用场景也越发多样。但在学术出版领域,利用AI修改论文需要作者审慎判断和认真审阅。您也可以考虑使用专业的语言润色服务,帮助您有效规避AI修改可能带来的风险。 文不厌改。精准出彩的表达需要深厚的专业知识沉淀、丰富的实践经验积累和细致入微的洞察力,爱思唯尔语言服务的编辑团队拥有覆盖100+学科的扎实背景,以顶刊标准提升您的每一篇科研成果,更有专属质量保障,助力您的成功发表!
  • 《“ChatGPT检测器”以前所未有的准确性捕捉到AI生成的论文》

    • 来源专题:数智化图书情报
    • 编译者:程冰
    • 发布时间:2023-11-08
    • 根据11月6日发表在《细胞报告物理科学》上的一项研究,机器学习工具可以轻松识别出使用聊天机器人ChatGPT撰写的化学论文。这个专门的分类器在两个现有的人工智能(AI)检测器中表现出色,可以帮助学术出版商识别由AI文本生成器创建的论文。 “大部分文本分析领域都希望有一个真正通用的检测器,可以适用于任何情况。”堪萨斯大学劳伦斯分校的化学家Heather Desaire说道。但是通过制作一个专注于特定类型纸张的工具,“我们真正追求的是准确性”。 研究结果表明,通过将软件定制为特定类型的写作,可以加快开发AI检测器的努力,德赛尔表示。“如果你能快速轻松地构建一件事情,那么为不同领域构建东西并不难。” 风格的要素 Desaire和她的同事们于今年6月首次描述了他们的ChatGPT检测器,当时他们将其应用于《科学》杂志的Perspective文章。通过机器学习,该检测器检查了20个写作风格的特征,包括句子长度的变化以及某些词语和标点符号的频率,以确定是一位学术科学家还是ChatGPT撰写了一段文本。研究结果显示,“你可以使用一小组特征来获得较高的准确性”,Desaire说道。 新的ChatGPT捕捉器甚至在没有接受训练的期刊引言中表现良好,并且能够捕捉到由各种提示创建的AI文本,包括旨在混淆AI检测器的提示。然而,该系统对科学期刊文章非常专业化。当面对大学报纸上的真实文章时,它无法识别出它们是由人类撰写的。 更广泛的问题 德博拉·韦伯-沃尔夫(Debora Weber-Wulff)是一位计算机科学家,她在柏林应用科技大学研究学术抄袭。她说,作者所做的是“令人着迷的事情”。她表示,许多现有的工具试图通过搜索AI生成写作的预测性文本模式来确定作者身份,而不是通过观察写作风格的特征。她说:“我从未想过在ChatGPT上使用文体学。” 但是韦伯-沃尔夫指出,在学术界使用ChatGPT存在其他问题。她指出,许多研究人员面临着迅速撰写论文的压力,或者他们可能不认为撰写论文的过程是科学的重要部分。AI检测工具无法解决这些问题,也不应被视为“解决社会问题的神奇软件解决方案”。