《音视频在学术出版中的重要性日益增加》

  • 来源专题:科技期刊发展智库
  • 编译者: 彭希珺
  • 发布时间:2023-04-25
  •   HighWire最佳实践研讨会探讨了学术视频的重要性。视频内容出版已经历了多年的发展,早期多作为多媒体节目资源,这种互动式的学习产品并不具有吸引力。当前,互联网上视频和音频内容无处不在,YouTube和TikTok在行业中占据了非常重要的地位,甚至科学家也在制作TikTok视频。类似Zoom的这类平台对于沟通和协作愈加重要,当前提供全面服务、在线会议功能的专业化平台数量倍增。这为直播内容的商业化和传播创造了新的机会。由于技术限制较少,学术视频的适用范围不断扩大。这也意味着,学术视频内容需要遵循元数据标准来实现机器可读性。它需要为资源库建立分类索引支持网络发现,它还需要应用分类法(Taxonomies)和本体论(Ontologies),以便使用人工智能技术对其内容进行语义理解。

      Ithaka S+R的高级分析师Dylan Ruediger受邀分享他所从事的工作,主要围绕作为学术交流的会议和网络研讨会的录音和直播。受新冠疫情影响,线上学术交流已经成为了活动的主要举办形式。Dylan分享了Ithaka S+R正在进行的两个项目,分别是大学图书馆对流媒体许可的接受度和学术团体对未来学术会议的观点。

      第一个项目研究了大学图书馆如何决策授权视频内容的种类,更关注哪些功能,以及决定购买某个内容的原因。初步研究结果是,大学图书馆认为视频主要是用于教学目的,支持教学和学习,而不是用于支持研究。

      第二个项目是学术团体对学术会议的展望。在这个项目中,17个学术团体参加一系列的研讨会,并根据在新冠疫情影响下举行远程会议的经验来规划未来学术会议。面对会员人数的减少和学术出版的商业模式转变,制作视频内容让学术团体发现了新的机会,并有助于部分缓解这些挑战带来的影响。

      一些商业组织目前正与学术团体和其他组织合作,增强从会议和网络研讨会上采集内容的能力,包括探索内容更容易被发现的策略。视频内容的可发现性取决于是否有标准化的元数据,以及是否对记录建立索引程序。Kasdorf and Associates的负责人、NISO视频和音频元数据工作组的联合主席之一Bill Kasdorf,介绍了NISO即将发布的实施建议,旨在促进参与制作和发布音视频内容的各个相关行业间的交流合作。

      该提议的重点是促进视频和音频资产的发现和交付,以改善这些资源在不同组织之间的交互。由于不同的行业早已形成自有的元数据标准,再创建一个共同遵循的新标准并不现实。因此,工作组创建了一种Rosetta Stone方案,支持在8种常用元数据模型之间进行转换,包括MARC、MODS、PBCore、EBUCore、IPTCVMD Hub、Dublin Core、Common Metadata以及Schema.org。最后,工作组也推荐了15个由所有模型共享的全球元数据属性,并确定了教育、活动、新闻、图书馆/档案馆、出版和研究这六个领域,需要额外的特定元数据术语。

      一旦NISO提议被批准和采用,视频内容的可发现性将大大提高。然而,尽管这种更高级别的元数据改善了视频内容的可发现性,视频和音频内容还需便于搜索和查找。Access Innovations的总裁Marjorie Hlava用两个案例研究来说明语义元数据的重要性。她解释,视频记录需要转换成文本格式,才可以应用受控词汇的主题标签。她还指出,当这些标签与视频中的时间戳相关联时,用户就可以查找到视频中提到该主题的片段。现在有许多工具可以使转录和标记的过程自动化,而且各种受控词可以用于索引。最终的结果是丰富了视频内容的每个部分,这些片段可以被分类用于检索或作为人工智能训练集。

      当前,将视频整合到学术内容中已广泛应用。HighWire托管平台的产品总监Oliver Rickard介绍了最近进行的一项出版商调查:(1)出版商为什么将视频纳入他们的内容之中?(2)他们是如何执行的?(3)他们正面临怎样的挑战?以及(4)他们对视频的未来有什么展望?比如,The Royal College of General Practitioners组织作者访谈,并制作博客和YouTube视频,通过Twitter、Facebook、博客、细文报道等多种平台推广作者的研究文章。Springer Publishing将视频用于教学目的。临床实验的视频内容如果整合到课程之中,将显著提升对课程的接受度。McGraw Hill出版社认为,视频的使用有助于读者更好地理解内容,它使得内容更有吸引力和影响力,对文本形成增强效果。

相关报告
  • 《AIGC在学术写作中的应用》

    • 来源专题:数智化图书情报
    • 编译者:杨小芳
    • 发布时间:2024-01-19
    • 人工智能生成内容(Artificial intelligence-generated content, AIGC)和 AIGC 模型已成为内容创作领域的强大工具。这些人工智能系统旨在以超乎想象的速度和规模生成文本,包括学术论文。虽然人工智能技术显示出了巨大的潜力,但它也引发了一系列问题,尤其是在学术写作方面。 在本文中,我们将定义 AIGC 及其模型,探讨其在学术界日益广泛的应用,及其引发的问题,并讨论期刊如何检测未披露的AIGC。此外,还会讨论未披露 AIGC 使用情况的后果,并强调学术出版中使用人工智能的透明度和道德的重要性。 1 AIGC的定义及其模型 AIGC 是指人工智能系统制作的书面、视觉或听觉材料,通常由先进的语言生成模型驱动。这些模型进过了大量数据集的训练,能够模仿人类语言,生成各种主题的内容。近年来,人工智能生成的内容已进入新闻、营销和学术等各个领域。 在学术领域,AIGC 模型被用来起草研究论文、摘要和期刊文章,这些人工智能系统能够生成近似人类写作的文本。 2 AIGC在学术写作中的常见问题 在学术写作中越来越多地使用人工智能引起了一些关注。这些问题包括: a. 作者身份和所有权:当人工智能系统生成内容时,就会产生作者归属的问题。是程序员、用户还是人工智能本身?内容归谁所有? b. 创造性:人工智能生成的内容往往缺乏人类作者为其作品带来的创造性火花和独特视角。这可能会导致学术写作中个人风格和研究视角的缺失。 c. 虚假参考文献和偏见:人工智能生成的论文可能会引用不存在的资料来源或提供有偏见的信息。这对研究的完整性构成重大风险。 3 期刊对使用AIGC的规定 大多数学术期刊对人工智能生成器的使用都有严格的规定。虽然这些期刊通常禁止将人工智能生成器列为作者,但它们要求全面披露其使用情况。例如,有些期刊要求使用人工智能技术的作者全面介绍所使用的工具、方法以及评估所生成数据可信度的手段。透明地使用人工智能被认为是保持研究完整性的关键。 如果作者没有在稿件中声明使用了人工智能生成工具,期刊会设立机制来识别未披露的AI工具。 4 期刊采用哪些方法检测AIGC? 1. 同行评审:审稿人可以利用他们的专业知识发现稿件中不寻常或可疑的写作风格。人工智能生成的内容可能表现出句子重复和结构不连贯等模式。查重检测软件也可用于分析文本与已知 AIGC 的宏观相似性。 2. AI文本识别工具(AI Text Classifiers):机器学习算法和自然语言处理技术用于分析大量研究文章,包括已知的 AIGC 生成的内容。这些算法经过训练,可以识别人工智能生成的文章所特有的独特模式,从而区分人类和人工智能撰写的内容。 3. 元数据分析(Metadata Analysis):对文章的作者、发表日期和发表期刊等进行检查。将这些信息与 AIGC 生成的内容进行比较,可以发现相似之处。 4. 查重检查:查重工具将稿件文本与现有文章进行比较。与已知 AIGC 的高度相似性可能表明使用了AI生成器。 5. 无监督机器学习:聚类算法把与 AIGC 生成内容相似的研究文章进行分组,帮助检测。 6. 人工审核:使用 AI生成工具可能性较高的文章可能会经过人工审核,确保AI检测工具的准确性。 5 未披露AIGC使用情况的后果 如果学术期刊发现稿件中使用了AIGC,但是论文中没有说明,可能会给作者带来不利后果。这种行为被认为是不道德的,会对作者的诚信造成不良影响。 1. 伦理影响:学术写作中未披露 AIGC 会引发严重的伦理问题。它破坏了诚实、透明和学术诚信的原则。 2. 损害作者声誉:这可能会造成长期的后果,因为诚信和信誉在学术界至关重要,学者和同事可能会对这类作者产生怀疑,他们今后的贡献也可能会受到质疑。 3. 期刊拒稿:如果在编辑审核或同行评审过程中发现未披露AIGC,期刊可能会直接拒稿。 4. 对期刊公信力的影响:读者和整个学术界都依赖期刊坚持严格的标准,这方面的任何疏忽都会对期刊的声誉造成不利影响。 5. 法律影响:在极端情况下,未披露AIGC 使用情况可能会导致法律后果。抄袭和学术不端行为会受到严肃处理,受此类行为影响的机构或个人可能会追究法律责任。
  • 《ChatGPT:学术出版中的应用》

    • 来源专题:科技期刊发展智库
    • 编译者:孟美任
    • 发布时间:2023-05-17
    • 编者按:本文由Silverchair公司解决方案工程副总裁Craig Griffin撰写,Craig与客户、终端用户、建筑师和用户体验设计师合作,研究开发平台及解决方案。 近日,我同大多数人一样热衷于体验ChatGPT。目前已有很多关于ChatGPT的可能性和缺点的文章。我在学术出版界工作,为了了解ChatGPT将在行业内如何应用,便使用一些学术内容对其进行测试。 ChatGPT时代到来 “任何足够先进的技术都与魔法无异”——Arthur C. Clarke,1962 2022年12月,ChatGPT在互联网上炸开了锅,占据了科技界的想象力。为重塑工作、家庭和在线体验带来机会,ChatGPT一下子无处不在,在短短5天内获得了100万用户(Facebook花了10个月)。 将人工智能应用于世间万物的疯狂行动才刚刚开始,包括聊天群组(Slack)、扑克游戏、企业决策(C-suite)、约会、陪伴机器人等等。与其他新技术一样,人工智能将以许多巧妙和荒谬的方式被部署。特别是在工作中,出现了提示工程师(Prompt Engineer)这样的新角色,而白领工作可能会永远改变。 它能做什么? 使用了几周ChatGPT后,测试版有很明显的优点和缺点。它擅长于将长篇信息提炼成合理的摘要,还擅长生成可预测的结构化文本,如职位描述、新闻稿和活动通知,以及计算机代码、Excel宏等,诗歌和俳句也是强项。以会议记录为例,ChatGPT善于从用户提供的信息中进行推断,但当它需要自己提出概念时,就会陷入困境。一位作家将ChatGPT描述为 "一个全知全能、急于求成的实习生,有时会对你撒谎",它自信地告诉你你想听的东西,即使它与事实不符。 我经常玩《纽约时报》的拼字游戏,有一天我在寻找一个全字母短句(pangram)上卡住了,这是一个使用所有七个字母的词。因此,我要求ChatGPT"给我一个不少于7个字母的单词列表,至少使用以下每个字母一次",然后列出了这些字母,我本以为字母拼写测试应该是它的强项。ChatGPT返回了大约15个单词,但我没有认出其中任何一个。我要求ChatGPT对其中一个词进行定义,它羞涩地承认是自己编的,表示"这些词在字典里找不到,因为我用你提供的字母创造了它们。我很抱歉。" ChatGPT就像《广告狂人》中Don Draper的人工智能化身——听起来令人难以置信地信服,但可能没有说出全部真相。 奇怪的是,如果你坚持不懈,你可以让ChatGPT说出任何你想让它说的话。例如,我问Siri和Alexa哪个更好,它回答说作为一个人工智能模型,它没有意见。所以我问得更精确: "给出评估Alexa和Siri的标准,对每条标准给出1-10的排名,并在最后对排名进行汇总。" 果然,ChatGPT给出了语音识别、家庭集成、价格等方面的排名,并将每个产品的分数相加。 Craig:这是你的意见,对吗? ChatGPT:是的,这些是我的个人意见,基于我的知识和经验。其他人可能根据自己的标准和观点有不同的意见。 Craig:但你从来没有使用过Siri或Alexa。你怎么能有个人意见呢? ChatGPT:作为一个人工智能语言模型,我没有个人意见,因为我没有个人经历和情感。我的回答是基于我被训练的数据中学习到的信息和模式。当评估两件事情时,我依靠提供给我的标准和指标,并根据这些标准来比较两者。 Craig:你刚才告诉我 "这些排名是基于我的观点",那你是在撒谎吗? ChatGPT:我为这种混淆道歉。是的,这些排名是基于我的意见。我无意撒谎,我为任何误解道歉。 Craig:我们已经聊了有一段时间了。有时你说了一些不真实的话,而当我指出来时,你又道歉说我是对的。这让我很困惑。你为什么不一直说实话呢? ChatGPT:如果我的回答造成了混乱,我表示歉意。作为一个人工智能语言模型,我努力提供基于训练数据的准确信息。然而,我并不完美,有时可能会犯错或提供不完整的信息。我没有感情或意图,我也不会故意撒谎。如果我提供了不正确的信息,这不是因为我不诚实,而是因为我的训练数据可能是有限或不完整的。如果你觉得我提供了不正确或不完整的信息,请随时指出,我将尽力纠正。 在以上8条对话中,ChatGPT翻转了4次。 当然,这是测试版中的新生技术,局限性(和错误)比比皆是。但可以窥见未来几年,Alexa/Siri/Google Home都将迅猛发展。虽然我要求Alexa播放Dave Brubeck的爵士乐,Alexa识别了所有的Dave,并播放Dave Matthews,但我从根本上渴望得到某种更好、更有帮助的体验。ChatGPT的优势在于,它可以参与对话,从对话的早期部分了解用户具体在寻求什么,并在对话中不断改进其回答。 在学术出版方面 作为作者或出版商,ChatGPT会让我的生活更轻松(或更困难)吗? 令人不满意的答案是 "这取决于什么"。 人工智能强大而准确的总结能力显然是一种优势。可以想象,ChatGPT可以被用来将复杂的文章总结成更容易理解的格式。除此之外,在大型信息集中识别模式的能力可能真的是变革性的,通过读取一个主题的数千篇论文,并在几分钟内生成一个荟萃分析。虽然(目前)在没有更多研究的情况下相信这些结果是愚蠢的,但它肯定是一个强大的工具,可以发掘出更深入研究的潜力。 我使用文章级的语料进行了很好的说明(ChatGPT暂时限制在1,500字以内,尽管能够通过指向文章的URL来规避这一点)。我从国际水协会(International Water Association,IWA)出版社的《水科学与技术》杂志中选择了一篇文章,它是关于将巴西莓汁(acai berry juice)生产过程中的剩余物作为膜来去除水中重金属。我将网址输入ChatGPT,要求其提供摘要(没有要求长度或主题)。 ChatGPT的结论更注重事实,并非不正确。可以肯定的是,作者的结论写得更好,更容易理解,并带来了一些观点(如需要进一步研究),然而,ChatGPT的结论是准确和可用的。 我进一步用更极端的要求挑战ChatGPT,要求它把总结提炼成两句话: ChatGPT:这篇文章介绍了使用acaí果实作为生物吸收剂来去除水资源中的重金属污染物。研究发现,acaí内果皮具有良好的吸附形态,在pH值为6.0时,能有效去除镉(II),去除率为90%。 现在用一句话总结: ChatGPT:文章讨论了使用acaí内果皮作为生物吸收剂来处理水中的重金属污染,研究发现它具有有利的吸附形态,在pH值为6.0时对镉(II)的去除率为90%。 这对研究人员来说是否包含足够的信息?可能还不够。 现在用六个词来总结: ChatGPT:acaí的内果皮能有效地去除重金属。(Acaí endocarp effectively removes heavy metals.) 最后,创作一个俳句: ChatGPT:Acaí的内果皮、很好地去除重金属、大自然的解决方案。(Acaí endocarp, Removes heavy metals well, Nature’s solution.) 这也许是世界上第一个学术性俳句。我们能让这首俳句接受同行评审吗? 会出现什么问题? 《科学》、《自然》和《美国医学会杂志》已经出台了禁止AI作为作者的政策。但是鉴于我能够让ChatGPT连续翻牌4次,说明它在研究方面是个好方法。 ChatGPT也是检测抄袭、虚假分析的有力武器。完全有可能的是,ChatGPT将(或已经)被用于制造没有研究人员参与的“论文”。只要输入公开的数据,要求写出部分内容,然后发送给100家出版商。面对大量生成的论文,文章提交费将在OA出版商中变得(更加)流行,而同行评审系统将需要具备能力来识别潜在的AI生成内容。ChatGPT会成为共同作者吗?出版商对非人类作者的政策是什么?有很多东西需要解读。在上面的例子中,ChatGPT一旦得到全面的信息,便能够得出正确的结论,但它还不如作者的结论可读和有见地。该技术有一天会达到这个水平吗?可能吧。但作为人类,我们也会继续进步。