《AIGC在学术写作中的应用》

  • 来源专题:数智化图书情报
  • 编译者: 杨小芳
  • 发布时间:2024-01-19
  • 人工智能生成内容(Artificial intelligence-generated content, AIGC)和 AIGC 模型已成为内容创作领域的强大工具。这些人工智能系统旨在以超乎想象的速度和规模生成文本,包括学术论文。虽然人工智能技术显示出了巨大的潜力,但它也引发了一系列问题,尤其是在学术写作方面。

    在本文中,我们将定义 AIGC 及其模型,探讨其在学术界日益广泛的应用,及其引发的问题,并讨论期刊如何检测未披露的AIGC。此外,还会讨论未披露 AIGC 使用情况的后果,并强调学术出版中使用人工智能的透明度和道德的重要性。

    1 AIGC的定义及其模型

    AIGC 是指人工智能系统制作的书面、视觉或听觉材料,通常由先进的语言生成模型驱动。这些模型进过了大量数据集的训练,能够模仿人类语言,生成各种主题的内容。近年来,人工智能生成的内容已进入新闻、营销和学术等各个领域。

    在学术领域,AIGC 模型被用来起草研究论文、摘要和期刊文章,这些人工智能系统能够生成近似人类写作的文本。

    2 AIGC在学术写作中的常见问题

    在学术写作中越来越多地使用人工智能引起了一些关注。这些问题包括:

    a. 作者身份和所有权:当人工智能系统生成内容时,就会产生作者归属的问题。是程序员、用户还是人工智能本身?内容归谁所有?

    b. 创造性:人工智能生成的内容往往缺乏人类作者为其作品带来的创造性火花和独特视角。这可能会导致学术写作中个人风格和研究视角的缺失。

    c. 虚假参考文献和偏见:人工智能生成的论文可能会引用不存在的资料来源或提供有偏见的信息。这对研究的完整性构成重大风险。

    3 期刊对使用AIGC的规定

    大多数学术期刊对人工智能生成器的使用都有严格的规定。虽然这些期刊通常禁止将人工智能生成器列为作者,但它们要求全面披露其使用情况。例如,有些期刊要求使用人工智能技术的作者全面介绍所使用的工具、方法以及评估所生成数据可信度的手段。透明地使用人工智能被认为是保持研究完整性的关键。

    如果作者没有在稿件中声明使用了人工智能生成工具,期刊会设立机制来识别未披露的AI工具。

    4 期刊采用哪些方法检测AIGC?

    1. 同行评审:审稿人可以利用他们的专业知识发现稿件中不寻常或可疑的写作风格。人工智能生成的内容可能表现出句子重复和结构不连贯等模式。查重检测软件也可用于分析文本与已知 AIGC 的宏观相似性。

    2. AI文本识别工具(AI Text Classifiers):机器学习算法和自然语言处理技术用于分析大量研究文章,包括已知的 AIGC 生成的内容。这些算法经过训练,可以识别人工智能生成的文章所特有的独特模式,从而区分人类和人工智能撰写的内容。

    3. 元数据分析(Metadata Analysis):对文章的作者、发表日期和发表期刊等进行检查。将这些信息与 AIGC 生成的内容进行比较,可以发现相似之处。

    4. 查重检查:查重工具将稿件文本与现有文章进行比较。与已知 AIGC 的高度相似性可能表明使用了AI生成器。

    5. 无监督机器学习:聚类算法把与 AIGC 生成内容相似的研究文章进行分组,帮助检测。

    6. 人工审核:使用 AI生成工具可能性较高的文章可能会经过人工审核,确保AI检测工具的准确性。

    5 未披露AIGC使用情况的后果

    如果学术期刊发现稿件中使用了AIGC,但是论文中没有说明,可能会给作者带来不利后果。这种行为被认为是不道德的,会对作者的诚信造成不良影响。

    1. 伦理影响:学术写作中未披露 AIGC 会引发严重的伦理问题。它破坏了诚实、透明和学术诚信的原则。

    2. 损害作者声誉:这可能会造成长期的后果,因为诚信和信誉在学术界至关重要,学者和同事可能会对这类作者产生怀疑,他们今后的贡献也可能会受到质疑。

    3. 期刊拒稿:如果在编辑审核或同行评审过程中发现未披露AIGC,期刊可能会直接拒稿。

    4. 对期刊公信力的影响:读者和整个学术界都依赖期刊坚持严格的标准,这方面的任何疏忽都会对期刊的声誉造成不利影响。

    5. 法律影响:在极端情况下,未披露AIGC 使用情况可能会导致法律后果。抄袭和学术不端行为会受到严肃处理,受此类行为影响的机构或个人可能会追究法律责任。

相关报告
  • 《人工智能在学术研究中的作用》

    • 来源专题:科技期刊发展智库
    • 编译者:董文杰
    • 发布时间:2023-09-07
    • 人工智能(AI)在学术研究领域的崛起近年来成为焦点,这种由机器学习和数据分析驱动的革命性技术正在深度改变各研究领域的格局。借助人工智能,研究人员得以处理大规模数据、抽取有价值的见解并将重复性任务自动化,进而有可能加速科学的探索步伐并提升研究成果的质量。 随着人工智能的不断进步,研究人员必须学会适应并利用这一工具,同时关注其潜在的局限性和伦理影响。通过在AI驱动的自动化和人类创新思维之间寻找平衡,研究人员可以开辟新的可能性,推动科学知识的发展,并为人工智能在学术研究领域的变革潜力作出贡献。 人工智能如何重塑学术领域? 人工智能为学术领域带来了重大改变,从根本上改变了研究、知识生成和教育方式的提供。将人工智能技术整合进学术界可能会简化流程、提高研究效率并催生创新。人工智能对学术界的改变主要体现在数据分析。研究人员可以利用AI算法快速有效地分析海量数据,使他们能够发现传统方法难以捕捉的模式、关联性和趋势。 人工智能正在改变研究过程本身。它通过自动扫描并提取大量科学论文中的相关信息,帮助研究人员进行文献综述和知识合成。这不仅节省了时间,还有助于研究人员了解其所在领域的最新动态。 人工智能对学术界产生重大影响的另一个领域是教育。人工智能技术正在被用于开发智能教辅系统、自适应学习平台以及个性化教育体验。这些技术可以分析学生的学习模式,提供个性化的反馈、支持和资源。 此外,人工智能还有可能增强学术界人员的能力。它可以将重复性任务自动化,从而为研究人员释放出时间,使他们可以专注于更高层次的认知活动。这包括数据收集、分析、甚至论文撰写的自动化。通过简化这些流程,研究人员能够将更多精力用于批判性思考、提出假设和探索新的研究路径。 人工智能在学术研究中的应用 人工智能已在各学科的学术研究中得到广泛应用。以下是一些人工智能在学术研究中的应用实例: ●数据分析和模式识别: 人工智能算法可以分析大型数据集,并识别人类难以识别的模式、相关性和趋势。这在基因组学、气候科学和社会科学等领域尤其有用。 ●自然语言处理(NLP): NLP技术使计算机能够理解和生成人类语言。研究人员利用NLP分析大量文本数据、提取信息、总结文档和检测情感。它应用于文学、语言学和社会科学等领域。 ●计算机视觉: 基于人工智能的计算机视觉系统可以处理和解释图像和视频等视觉数据。研究人员利用计算机视觉分析医疗图像、卫星图像和监控录像等。它可应用于生物学、天文学和环境科学等领域。 ●药物发现与开发:人工智能正被用于预测潜在药物化合物的特性及相互作用,以此加快药物发现过程。机器学习模型能够分析大量的化学和生物数据,确定潜在的药物目标并设计新的分子。 ●机器人和自动化:人工智能驱动的机器人和自动化系统正越来越多地用于学术研究,以执行实验室实验、数据收集和样本处理等任务。这些机器人可以全天候工作,减少人为错误,提高研究工作流程的效率。 ●推荐系统:人工智能算法可以根据用户的偏好和行为提供个性化推荐。在学术界,这些系统可根据研究人员的兴趣和以往工作推荐相关的研究论文、会议或合作项目。 ●模拟和建模:机器学习和神经网络等人工智能技术可用于创建复杂的模型和模拟。研究人员可以利用这些模型来研究和预测物理学、经济学和社会科学等领域的现象。 ●知识发现与整合:人工智能能够帮助研究人员从众多的研究论文、专利及其他学术资源中发现并整合信息。这有助于揭示研究空白、查找相关文献并产生新的见解。 人工智能驱动的学术研究面临的挑战和伦理问题 ●数据偏见和公平性:人工智能系统根据数据进行训练,如果训练数据存在偏见或反映了社会偏见,人工智能模型可能会延续这些偏见。研究人员需要仔细整理和预处理数据,以确保公平性并减少人工智能模型中的偏见。 ●隐私和数据保护:人工智能研究通常涉及处理大量数据,包括个人和敏感信息。研究人员必须确保数据收集、存储和分析遵守相关隐私法规,并获得参与者的知情同意。 ●透明性与可解释性:一些人工智能算法(例如深度学习模型)被视为"黑盒子",其决策过程难以理解和解释。在学术研究中,需要努力提高其透明度,并找出一种方法来解释人工智能推理背后的原理。 ●可重复性和稳健性:研究者应通过提供清晰的人工智能模型、算法和数据集的文档以实现可复制性。关键在于确保人工智能模型的稳健性,使其能够在未接触过的数据中进行泛化,防止过度拟合或结果偏差。 ●知识产权和所有权:人工智能研究通常涉及到合作以及对现有的数据集和模型的使用。需要为知识产权、数据所有权以及研究者间的人工智能模型和代码共享制定明确的指导原则。 ●责任与义务:随着人工智能的日益自主化,问责和责任问题也随之而来。研究者必须考虑其人工智能系统的道德影响,并意识到其部署可能带来的潜在风险和后果。 ●社会影响和工作岗位转移:人工智能技术可能颠覆所有行业,并导致某些工作角色被自动化。研究者应关注其人工智能驱动的研究可能带来的社会影响,并努力确保公平的过渡,创造就业机会并最大程度地减少负面影响。 ●双重用途和滥用:为学术研究开发的人工智能技术既有积极的应用,也存在被滥用的风险。研究者应注意潜在的双重用途问题,并考虑其工作的道德影响,以防止滥用或无意的伤害。 人工智能在学术研究领域的潜力 ●跨学科合作:人工智能将不同学科的研究者联合起来,推动合作并实现突破性的发现。 ●数据驱动的发现:人工智能算法从大型数据集中提取有价值的见解,彻底改变了跨学科研究。 ●个性化和适应性学习:人工智能技术提供量身定制的教育体验,评估学生成绩并提供有针对性的反馈。 ●增强科学发现的能力:人工智能协助研究人员进行假设生成、实验设计和数据分析,加快研究进程。 ●道德考量和负责任的人工智能:研究者正在解决偏见、透明度、隐私和问责等问题,以确保人工智能的道德和负责任地使用。 ●人工智能自动化:人工智能简化了研究工作流程,实现了数据收集和分析等任务的自动化,提高了效率。 ●人工智能应对全球挑战:通过分析数据和优化资源配置,人工智能有助于解决气候变化、医疗保健和贫困问题。 ●增强创造力:人工智能是创造性的合作伙伴,它能够产生创意、综合信息,并在艺术和设计等领域推动创新。 ●增强同行评审和学术交流:人工智能实现了同行评审的自动化,协助语言翻译,并推荐相关研究论文。 ●研究民主化:人工智能平台在全球范围内提供计算能力、数据集和合作机会,使研究民主化。 用于学术研究的人工智能工具 ●Pictory:Pictory是一款人工智能驱动的视频生成器,可简化创建和编辑高质量视频的过程。 ●Jasper:Jasper是顶级的人工智能写作助手,以其卓越的功能和出色的质量在市场上树立了标准。 ●Murf:Murf是一款文本转语音生成器,被公认为市场上最受欢迎、最出色的人工智能语音生成器之一。 ●HitPaw照片增强器: 基于人工智能的提高图像质量和细节的工具。 ●ChatGPT:用于自然语言处理和生成类人文本回复的人工智能模型。 ●Lovo.ai:Lovo.ai作为一个屡获殊荣的语音生成器和文本到语音解决方案,赢得了赞誉。 ●Reply.io:Reply提供了一个全面的销售参与平台,能够以可扩展的方式创造新的机会,同时确保每次互动都具有个性化的触感。
  • 《ChatGPT:学术出版中的应用》

    • 来源专题:科技期刊发展智库
    • 编译者:孟美任
    • 发布时间:2023-05-17
    • 编者按:本文由Silverchair公司解决方案工程副总裁Craig Griffin撰写,Craig与客户、终端用户、建筑师和用户体验设计师合作,研究开发平台及解决方案。 近日,我同大多数人一样热衷于体验ChatGPT。目前已有很多关于ChatGPT的可能性和缺点的文章。我在学术出版界工作,为了了解ChatGPT将在行业内如何应用,便使用一些学术内容对其进行测试。 ChatGPT时代到来 “任何足够先进的技术都与魔法无异”——Arthur C. Clarke,1962 2022年12月,ChatGPT在互联网上炸开了锅,占据了科技界的想象力。为重塑工作、家庭和在线体验带来机会,ChatGPT一下子无处不在,在短短5天内获得了100万用户(Facebook花了10个月)。 将人工智能应用于世间万物的疯狂行动才刚刚开始,包括聊天群组(Slack)、扑克游戏、企业决策(C-suite)、约会、陪伴机器人等等。与其他新技术一样,人工智能将以许多巧妙和荒谬的方式被部署。特别是在工作中,出现了提示工程师(Prompt Engineer)这样的新角色,而白领工作可能会永远改变。 它能做什么? 使用了几周ChatGPT后,测试版有很明显的优点和缺点。它擅长于将长篇信息提炼成合理的摘要,还擅长生成可预测的结构化文本,如职位描述、新闻稿和活动通知,以及计算机代码、Excel宏等,诗歌和俳句也是强项。以会议记录为例,ChatGPT善于从用户提供的信息中进行推断,但当它需要自己提出概念时,就会陷入困境。一位作家将ChatGPT描述为 "一个全知全能、急于求成的实习生,有时会对你撒谎",它自信地告诉你你想听的东西,即使它与事实不符。 我经常玩《纽约时报》的拼字游戏,有一天我在寻找一个全字母短句(pangram)上卡住了,这是一个使用所有七个字母的词。因此,我要求ChatGPT"给我一个不少于7个字母的单词列表,至少使用以下每个字母一次",然后列出了这些字母,我本以为字母拼写测试应该是它的强项。ChatGPT返回了大约15个单词,但我没有认出其中任何一个。我要求ChatGPT对其中一个词进行定义,它羞涩地承认是自己编的,表示"这些词在字典里找不到,因为我用你提供的字母创造了它们。我很抱歉。" ChatGPT就像《广告狂人》中Don Draper的人工智能化身——听起来令人难以置信地信服,但可能没有说出全部真相。 奇怪的是,如果你坚持不懈,你可以让ChatGPT说出任何你想让它说的话。例如,我问Siri和Alexa哪个更好,它回答说作为一个人工智能模型,它没有意见。所以我问得更精确: "给出评估Alexa和Siri的标准,对每条标准给出1-10的排名,并在最后对排名进行汇总。" 果然,ChatGPT给出了语音识别、家庭集成、价格等方面的排名,并将每个产品的分数相加。 Craig:这是你的意见,对吗? ChatGPT:是的,这些是我的个人意见,基于我的知识和经验。其他人可能根据自己的标准和观点有不同的意见。 Craig:但你从来没有使用过Siri或Alexa。你怎么能有个人意见呢? ChatGPT:作为一个人工智能语言模型,我没有个人意见,因为我没有个人经历和情感。我的回答是基于我被训练的数据中学习到的信息和模式。当评估两件事情时,我依靠提供给我的标准和指标,并根据这些标准来比较两者。 Craig:你刚才告诉我 "这些排名是基于我的观点",那你是在撒谎吗? ChatGPT:我为这种混淆道歉。是的,这些排名是基于我的意见。我无意撒谎,我为任何误解道歉。 Craig:我们已经聊了有一段时间了。有时你说了一些不真实的话,而当我指出来时,你又道歉说我是对的。这让我很困惑。你为什么不一直说实话呢? ChatGPT:如果我的回答造成了混乱,我表示歉意。作为一个人工智能语言模型,我努力提供基于训练数据的准确信息。然而,我并不完美,有时可能会犯错或提供不完整的信息。我没有感情或意图,我也不会故意撒谎。如果我提供了不正确的信息,这不是因为我不诚实,而是因为我的训练数据可能是有限或不完整的。如果你觉得我提供了不正确或不完整的信息,请随时指出,我将尽力纠正。 在以上8条对话中,ChatGPT翻转了4次。 当然,这是测试版中的新生技术,局限性(和错误)比比皆是。但可以窥见未来几年,Alexa/Siri/Google Home都将迅猛发展。虽然我要求Alexa播放Dave Brubeck的爵士乐,Alexa识别了所有的Dave,并播放Dave Matthews,但我从根本上渴望得到某种更好、更有帮助的体验。ChatGPT的优势在于,它可以参与对话,从对话的早期部分了解用户具体在寻求什么,并在对话中不断改进其回答。 在学术出版方面 作为作者或出版商,ChatGPT会让我的生活更轻松(或更困难)吗? 令人不满意的答案是 "这取决于什么"。 人工智能强大而准确的总结能力显然是一种优势。可以想象,ChatGPT可以被用来将复杂的文章总结成更容易理解的格式。除此之外,在大型信息集中识别模式的能力可能真的是变革性的,通过读取一个主题的数千篇论文,并在几分钟内生成一个荟萃分析。虽然(目前)在没有更多研究的情况下相信这些结果是愚蠢的,但它肯定是一个强大的工具,可以发掘出更深入研究的潜力。 我使用文章级的语料进行了很好的说明(ChatGPT暂时限制在1,500字以内,尽管能够通过指向文章的URL来规避这一点)。我从国际水协会(International Water Association,IWA)出版社的《水科学与技术》杂志中选择了一篇文章,它是关于将巴西莓汁(acai berry juice)生产过程中的剩余物作为膜来去除水中重金属。我将网址输入ChatGPT,要求其提供摘要(没有要求长度或主题)。 ChatGPT的结论更注重事实,并非不正确。可以肯定的是,作者的结论写得更好,更容易理解,并带来了一些观点(如需要进一步研究),然而,ChatGPT的结论是准确和可用的。 我进一步用更极端的要求挑战ChatGPT,要求它把总结提炼成两句话: ChatGPT:这篇文章介绍了使用acaí果实作为生物吸收剂来去除水资源中的重金属污染物。研究发现,acaí内果皮具有良好的吸附形态,在pH值为6.0时,能有效去除镉(II),去除率为90%。 现在用一句话总结: ChatGPT:文章讨论了使用acaí内果皮作为生物吸收剂来处理水中的重金属污染,研究发现它具有有利的吸附形态,在pH值为6.0时对镉(II)的去除率为90%。 这对研究人员来说是否包含足够的信息?可能还不够。 现在用六个词来总结: ChatGPT:acaí的内果皮能有效地去除重金属。(Acaí endocarp effectively removes heavy metals.) 最后,创作一个俳句: ChatGPT:Acaí的内果皮、很好地去除重金属、大自然的解决方案。(Acaí endocarp, Removes heavy metals well, Nature’s solution.) 这也许是世界上第一个学术性俳句。我们能让这首俳句接受同行评审吗? 会出现什么问题? 《科学》、《自然》和《美国医学会杂志》已经出台了禁止AI作为作者的政策。但是鉴于我能够让ChatGPT连续翻牌4次,说明它在研究方面是个好方法。 ChatGPT也是检测抄袭、虚假分析的有力武器。完全有可能的是,ChatGPT将(或已经)被用于制造没有研究人员参与的“论文”。只要输入公开的数据,要求写出部分内容,然后发送给100家出版商。面对大量生成的论文,文章提交费将在OA出版商中变得(更加)流行,而同行评审系统将需要具备能力来识别潜在的AI生成内容。ChatGPT会成为共同作者吗?出版商对非人类作者的政策是什么?有很多东西需要解读。在上面的例子中,ChatGPT一旦得到全面的信息,便能够得出正确的结论,但它还不如作者的结论可读和有见地。该技术有一天会达到这个水平吗?可能吧。但作为人类,我们也会继续进步。