《 Web3技术将为学术出版带来新的变革》

  • 来源专题:科技期刊发展智库
  • 编译者: 郭林林
  • 发布时间:2023-11-21
  •   目前的学术出版生态系统具有高度的剥削性和不公平性:它限制了科学进步和发展的机会;它有利于目前学术出版社的寡头垄断及其股东,却牺牲了公众的利益。Web3技术将为目前的局面带来新的可能。

      在目前的学术体系中,科学家必须不断提供其“生产力”的证据,以促进他们职业生涯的发展(即被雇用或晋升),并为其未来的研究计划获得资金,因为这是目前雇主和资助机构主流的评价方式。在科学评价过程中评审者几乎没有时间充分参与每个科学家的研究工作,彻底研究一位科学家以前的所有工作可能需要几天、几周甚至几个月,再勤奋、善意的评审者也无法做到,因此,他们的时间限制迫使他们依赖启发式方法,以便更容易评估科学家的工作。

      对一篇科学出版物影响力(重要性和质量)的评价通常参照它收到的引用次数。一篇文章被引用的次数越多,它就被认为对某一领域的科学论述越重要。引文很容易计算和比较,因此成为判断科学家是否成功的流行定量启发式方法。用引文作为影响力或质量的代表,有一个明显的问题,即科学工作需要时间来传播和积累引文。平均而言,科学论文在发表后的2~5年内达到引用的高峰,这使得用引文数来评估科学家最新工作的影响是不切实际的。

      因此,在许多科学领域,有声望的学术期刊已经成为科学合法性的守门人。学术期刊的主要作用是选择和发表重要的科学贡献。筛选过程是基于编辑的决定,即哪些投稿属于期刊的范围,并且“足够好”,可以通过同行评审进行详细评估。如果一篇文章引起了编辑的兴趣,编辑就会决定邀请谁来审查该论文。根据这些审查,编辑会做出最终决定,决定是否对一篇文章录用、拒绝或提出修改意见。因此,知名期刊的编辑和审稿人在科学界有很大的影响力。

      衡量期刊声望的最突出的指标是其影响因子,即过去两年发表的文章的年平均引用次数。影响因子是一个衡量标准,将一个期刊上发表的所有论文的声誉集中起来,而不考虑其实际的个人质量和影响。然而,期刊内部的引文分布通常是高度倾斜的——期刊中大约一半的可引用论文往往占到期刊总引文的85%。

      由于在同一期刊上发表的文章在引用模式上的巨大差异,因此影响因子只是一个非常粗略的方式。此外,小型期刊的影响因子对收录一篇或几篇迅速积累大量引文的文章可能非常敏感。不同领域的期刊影响因子也有很大差异,部分原因是普遍的引文文化和一个学术学科的绝对规模,但也与期刊规模和出版物类型(如信件、社论、新闻条目、评论)相关。因此,期刊的影响因子有时与其发表的文章质量无关。

      传统学术期刊要求作者将版权转让给出版商。版权是一种知识产权,赋予其所有者复制创造性作品的专有权,从而为版权所有者创造垄断权力,使作品货币化。学术出版物市场主要由五家大型营利性公司(Elsevier、Black & Wiley、Taylor & Francis、Springer Nature和SAGE)主导,它们共同控制着50%以上的市场。全世界学术论文使用权的销售额超过190亿美元,这使得学术出版业的收入介于音乐产业和电影产业之间。

      出版公司的两种主要商业模式是“付费获取”和“付费出版”,这两种模式都依靠科学家无偿的同行评审,这相当于科学家向出版业捐赠了数十亿美元,出版社利用公共资金或研究人员的私人时间来提高利润,并剥夺了科学家进行高质量评审工作的应有的公平回报。

      近年来,我们见证了免费替代方案的兴起:预印本平台(如bioRxiv、medRxiv或SSRN),它们允许科学家在网上发布其手稿的早期版本。这些预印本平台效仿物理学家依靠Arxiv在圈子里分发自己工作成果的做法。与此类似,经济学家也依赖NBER等工作文件平台,主要是因为在知名的经济杂志上发表文章往往需要多年时间。然而,预印本和工作论文没有经过同行评审,往往与最终发表版本大相径庭,或者根本没有被需要同行评审的期刊接受发表。因此,非专业的读者很难/不可能评估他们能否相信这些渠道的内容。正如我们在COVID疫情中所看到的,预印本平台,尤其是在医学领域,可能被滥用于传播错误信息和不可靠的科学研究。

      最近的一波浪潮是Web3技术,该技术实现了互联网的去中心化版本,其基础是越来越多的公开可用、防篡改记录的对等网络,允许大规模协作。Web3是对Web2的中心化、不透明、数据篱笆原则的有力背离。Web2是注意力经济,也是Facebook、Google等公司成功的基础,也是寡头垄断的学术出版商的专有、垂直整合的平台。与此相反,Web3的核心前提是将所有权广泛地分配给用户,以及通过分布式账本技术构建无需信任、抗审查的执行代码。随着Web3越来越多被采用,应用程序也越来越多。

      Web3的核心承诺是,通过利益相关者的激励协调,以无信任、抗审查的方式执行代码,并通过点对点的网络进行协调,将价值广泛地重新分配给用户。建立在这些网络之上的是去中心化的自治组织(Decentralized Autonomous Organization, DAO),即由贡献者和活跃用户组成的社区,他们通过共同拥有和共同管理这些网络进行合作。Web3原生的互操作数据模型,如IPLD,结合存储激励层(如Filecoin),可以使每个人都能永久地获得科学。Web3上的持久性标识符(PID)被内容标识符(CID)取代。与PID不同的是,CID是加密的,以提供对其基本内容的防篡改映射。

      与DOI(出版业的PID和主键)不同,Web3的CIDs可以随意发布,不受链接失效的影响,并且不受内容漂移的影响,其维护成本很高,并且依赖于由出版业控制的集中式机构。从Web2PIDs到Web3CIDs的转变将是一个范式的转变,我们有能力产生丰富的、相互关联的、不可改变的知识图谱(CID-图谱),并从这些关系中自动生成丰富的科学元数据。这样的Web3知识图谱将揭示研究领域内的联系的新信息。

      当前最知名的Web3示例是NFT。这些不可替代的代币( Non-Fungible Token,NFT)为用户提供了区块链中各个条目使用加密货币购买的数字资产的所有权证明。许多出版商(如《南华早报》、《时代》、《甘尼特》和《经济学人》)都成功地尝试了创建NFT。

      2022年3月,《南华早报》通过13 000个NFT发布自1997年以来的所有历史性“头版”故事筹集了250 000美元。这些NFT的销售和包装具有创新性和战略性,因为它们随机包装在价格相同的神秘盒子中。每个盒子里有五件藏品,所有的NFT盒子在5小时内售罄。幸运的收藏家获得了极为罕见的首页,他们可以将其添加到收藏品中或转售以获得可观的利润。

      在Web3应用于科学的领域,一些先驱者已经开始行动。现在已经有了一个生态系统,VitaDAO是一个范例,它将世界上一些研究实验室聚集在一起,为他们的研究提供资金,并对由此产生的知识产权拥有权益。其他项目,如ResearchHub,正试图通过类似Reddit的社会机制,对科学工作进行众包策划。


    原文题目:1.  osblockchain 智编专家 公众号:Web3技术将为学术出版带来新的变革; 2. Web3 for

    news publishers: What's the long-term potential? 3. 学术出版市场为何需要用Web3技术重构?


    原文链接:1.https://mp.weixin.qq.com/s/AG8EHH4Cl4TUp1VJj-2HVQ; 2.https://whatsnewinpublishing.com/web3-for-news-publishers-whats-the-long-term-potential/;3.https://www.zilian8.com/870083.html


相关报告
  • 《ChatGPT:学术出版中的应用》

    • 来源专题:科技期刊发展智库
    • 编译者:孟美任
    • 发布时间:2023-05-17
    • 编者按:本文由Silverchair公司解决方案工程副总裁Craig Griffin撰写,Craig与客户、终端用户、建筑师和用户体验设计师合作,研究开发平台及解决方案。 近日,我同大多数人一样热衷于体验ChatGPT。目前已有很多关于ChatGPT的可能性和缺点的文章。我在学术出版界工作,为了了解ChatGPT将在行业内如何应用,便使用一些学术内容对其进行测试。 ChatGPT时代到来 “任何足够先进的技术都与魔法无异”——Arthur C. Clarke,1962 2022年12月,ChatGPT在互联网上炸开了锅,占据了科技界的想象力。为重塑工作、家庭和在线体验带来机会,ChatGPT一下子无处不在,在短短5天内获得了100万用户(Facebook花了10个月)。 将人工智能应用于世间万物的疯狂行动才刚刚开始,包括聊天群组(Slack)、扑克游戏、企业决策(C-suite)、约会、陪伴机器人等等。与其他新技术一样,人工智能将以许多巧妙和荒谬的方式被部署。特别是在工作中,出现了提示工程师(Prompt Engineer)这样的新角色,而白领工作可能会永远改变。 它能做什么? 使用了几周ChatGPT后,测试版有很明显的优点和缺点。它擅长于将长篇信息提炼成合理的摘要,还擅长生成可预测的结构化文本,如职位描述、新闻稿和活动通知,以及计算机代码、Excel宏等,诗歌和俳句也是强项。以会议记录为例,ChatGPT善于从用户提供的信息中进行推断,但当它需要自己提出概念时,就会陷入困境。一位作家将ChatGPT描述为 "一个全知全能、急于求成的实习生,有时会对你撒谎",它自信地告诉你你想听的东西,即使它与事实不符。 我经常玩《纽约时报》的拼字游戏,有一天我在寻找一个全字母短句(pangram)上卡住了,这是一个使用所有七个字母的词。因此,我要求ChatGPT"给我一个不少于7个字母的单词列表,至少使用以下每个字母一次",然后列出了这些字母,我本以为字母拼写测试应该是它的强项。ChatGPT返回了大约15个单词,但我没有认出其中任何一个。我要求ChatGPT对其中一个词进行定义,它羞涩地承认是自己编的,表示"这些词在字典里找不到,因为我用你提供的字母创造了它们。我很抱歉。" ChatGPT就像《广告狂人》中Don Draper的人工智能化身——听起来令人难以置信地信服,但可能没有说出全部真相。 奇怪的是,如果你坚持不懈,你可以让ChatGPT说出任何你想让它说的话。例如,我问Siri和Alexa哪个更好,它回答说作为一个人工智能模型,它没有意见。所以我问得更精确: "给出评估Alexa和Siri的标准,对每条标准给出1-10的排名,并在最后对排名进行汇总。" 果然,ChatGPT给出了语音识别、家庭集成、价格等方面的排名,并将每个产品的分数相加。 Craig:这是你的意见,对吗? ChatGPT:是的,这些是我的个人意见,基于我的知识和经验。其他人可能根据自己的标准和观点有不同的意见。 Craig:但你从来没有使用过Siri或Alexa。你怎么能有个人意见呢? ChatGPT:作为一个人工智能语言模型,我没有个人意见,因为我没有个人经历和情感。我的回答是基于我被训练的数据中学习到的信息和模式。当评估两件事情时,我依靠提供给我的标准和指标,并根据这些标准来比较两者。 Craig:你刚才告诉我 "这些排名是基于我的观点",那你是在撒谎吗? ChatGPT:我为这种混淆道歉。是的,这些排名是基于我的意见。我无意撒谎,我为任何误解道歉。 Craig:我们已经聊了有一段时间了。有时你说了一些不真实的话,而当我指出来时,你又道歉说我是对的。这让我很困惑。你为什么不一直说实话呢? ChatGPT:如果我的回答造成了混乱,我表示歉意。作为一个人工智能语言模型,我努力提供基于训练数据的准确信息。然而,我并不完美,有时可能会犯错或提供不完整的信息。我没有感情或意图,我也不会故意撒谎。如果我提供了不正确的信息,这不是因为我不诚实,而是因为我的训练数据可能是有限或不完整的。如果你觉得我提供了不正确或不完整的信息,请随时指出,我将尽力纠正。 在以上8条对话中,ChatGPT翻转了4次。 当然,这是测试版中的新生技术,局限性(和错误)比比皆是。但可以窥见未来几年,Alexa/Siri/Google Home都将迅猛发展。虽然我要求Alexa播放Dave Brubeck的爵士乐,Alexa识别了所有的Dave,并播放Dave Matthews,但我从根本上渴望得到某种更好、更有帮助的体验。ChatGPT的优势在于,它可以参与对话,从对话的早期部分了解用户具体在寻求什么,并在对话中不断改进其回答。 在学术出版方面 作为作者或出版商,ChatGPT会让我的生活更轻松(或更困难)吗? 令人不满意的答案是 "这取决于什么"。 人工智能强大而准确的总结能力显然是一种优势。可以想象,ChatGPT可以被用来将复杂的文章总结成更容易理解的格式。除此之外,在大型信息集中识别模式的能力可能真的是变革性的,通过读取一个主题的数千篇论文,并在几分钟内生成一个荟萃分析。虽然(目前)在没有更多研究的情况下相信这些结果是愚蠢的,但它肯定是一个强大的工具,可以发掘出更深入研究的潜力。 我使用文章级的语料进行了很好的说明(ChatGPT暂时限制在1,500字以内,尽管能够通过指向文章的URL来规避这一点)。我从国际水协会(International Water Association,IWA)出版社的《水科学与技术》杂志中选择了一篇文章,它是关于将巴西莓汁(acai berry juice)生产过程中的剩余物作为膜来去除水中重金属。我将网址输入ChatGPT,要求其提供摘要(没有要求长度或主题)。 ChatGPT的结论更注重事实,并非不正确。可以肯定的是,作者的结论写得更好,更容易理解,并带来了一些观点(如需要进一步研究),然而,ChatGPT的结论是准确和可用的。 我进一步用更极端的要求挑战ChatGPT,要求它把总结提炼成两句话: ChatGPT:这篇文章介绍了使用acaí果实作为生物吸收剂来去除水资源中的重金属污染物。研究发现,acaí内果皮具有良好的吸附形态,在pH值为6.0时,能有效去除镉(II),去除率为90%。 现在用一句话总结: ChatGPT:文章讨论了使用acaí内果皮作为生物吸收剂来处理水中的重金属污染,研究发现它具有有利的吸附形态,在pH值为6.0时对镉(II)的去除率为90%。 这对研究人员来说是否包含足够的信息?可能还不够。 现在用六个词来总结: ChatGPT:acaí的内果皮能有效地去除重金属。(Acaí endocarp effectively removes heavy metals.) 最后,创作一个俳句: ChatGPT:Acaí的内果皮、很好地去除重金属、大自然的解决方案。(Acaí endocarp, Removes heavy metals well, Nature’s solution.) 这也许是世界上第一个学术性俳句。我们能让这首俳句接受同行评审吗? 会出现什么问题? 《科学》、《自然》和《美国医学会杂志》已经出台了禁止AI作为作者的政策。但是鉴于我能够让ChatGPT连续翻牌4次,说明它在研究方面是个好方法。 ChatGPT也是检测抄袭、虚假分析的有力武器。完全有可能的是,ChatGPT将(或已经)被用于制造没有研究人员参与的“论文”。只要输入公开的数据,要求写出部分内容,然后发送给100家出版商。面对大量生成的论文,文章提交费将在OA出版商中变得(更加)流行,而同行评审系统将需要具备能力来识别潜在的AI生成内容。ChatGPT会成为共同作者吗?出版商对非人类作者的政策是什么?有很多东西需要解读。在上面的例子中,ChatGPT一旦得到全面的信息,便能够得出正确的结论,但它还不如作者的结论可读和有见地。该技术有一天会达到这个水平吗?可能吧。但作为人类,我们也会继续进步。
  • 《牛津大学出版社在南非达成首个变革性协议》

    • 来源专题:科技期刊发展智库
    • 编译者:唐果媛
    • 发布时间:2023-07-14
    •   2023年3月29日,牛津大学出版社(OUP)和非营利组织南非国家图书馆和信息联盟(SANLIC)达成了一项为期三年的全国阅读出版协议。该协议将立即生效,支持SANLIC成员机构的研究人员公开发表他们的作品,并为那些附属机构提供完全访问OUP高质量期刊集的机会。   与SANLIC的协议是OUP在非洲的首份阅读和出版协议,也是全球第35份。这反映了该组织继续致力于推动开放获取出版,这符合其使命,即通过在全球范围内出版来推动牛津大学在研究、学术和教育方面的卓越目标。   牛津大学出版社销售总监Alastair Lewis在谈到该协议时表示,“我很高兴宣布与SANLIC达成新的变革性协议,并期待其成员和研究界受益。作为开放获取研究最大,大学出版社,我们相信阅读和出版协议在支持向开放获取的可持续过渡方面发挥着关键作用。”   SANLiC董事会主席Ellen Tise说:“牛津大学出版社是我们研究人员的一个重要出版场所,这项协议使他们能够在以前通常负担不起的期刊上完全公开发表。这是对以前仅限于阅读访问这些信息资源的协议的最重大进步。这项协议使我们的成员机构能够重新调整订阅支出的用途,为开放获取出版提供资金,并显著提高南非机构的研究和学习能力。”   该协议是继最近与奥地利学术图书馆联盟和 瑞士学术图书馆联合会(CSAL)签署了一系列新的全球阅读和出版协议以及主要合同之后达成的。