基于共引网络的出版物影响力评价新指标：相对引用率

《基于共引网络的出版物影响力评价新指标：相对引用率》

来源专题：图书情报
编译者： luoluo
发布时间：2020-08-13
2020年，《情报理论与实践》出版了一篇名为“基于共引网络的出版物影响力评价新指标：相对引用率”的文章。近年来在科研基金分配和学术成果评价中，应用规范化评价指标已经成为国内外科学计量评价领域的共识。美国国立卫生研究院(NIH)提出基于共引网络的评价指标——相对引用率(Relative Citation Ratio，简称RCR)。为了证明这种新指标的优势，探究与其他类型的归一化指标的异同，文章分别对不同地域的不同学科期刊文献、交叉学科文献及单学科文献，检验RCR与学科规范引文影响力(CNCI)指标是否正向显著相关。该文章利用InCites数据库分别检索2016年全球、中国、美国地区的共计22个ESI学科期刊文献，8种交叉学科期刊文献和ESI的8个不同领域被引频次最高的单学科期刊文献，分别计算文献的RCR与CNCI，进行相关性检验。结果显示不同地域的不同学科期刊文献、交叉学科文献及单学科期刊文献，RCR与CNCI均显示正向显著相关，交叉学科文献的相关系数低于单学科文献。对于跨学科文献的影响力评估，RCR指标避免以往归一化算法因多个学科属性归属问题导致的干扰，具有一定优势。

展开更多

232浏览量

0点赞

原文链接

相关报告

《 Web3技术将为学术出版带来新的变革》

来源专题：科技期刊发展智库

编译者：郭林林

发布时间：2023-11-21

目前的学术出版生态系统具有高度的剥削性和不公平性：它限制了科学进步和发展的机会；它有利于目前学术出版社的寡头垄断及其股东，却牺牲了公众的利益。Web3技术将为目前的局面带来新的可能。在目前的学术体系中，科学家必须不断提供其“生产力”的证据，以促进他们职业生涯的发展(即被雇用或晋升)，并为其未来的研究计划获得资金，因为这是目前雇主和资助机构主流的评价方式。在科学评价过程中评审者几乎没有时间充分参与每个科学家的研究工作，彻底研究一位科学家以前的所有工作可能需要几天、几周甚至几个月，再勤奋、善意的评审者也无法做到，因此，他们的时间限制迫使他们依赖启发式方法，以便更容易评估科学家的工作。对一篇科学出版物影响力(重要性和质量)的评价通常参照它收到的引用次数。一篇文章被引用的次数越多，它就被认为对某一领域的科学论述越重要。引文很容易计算和比较，因此成为判断科学家是否成功的流行定量启发式方法。用引文作为影响力或质量的代表，有一个明显的问题，即科学工作需要时间来传播和积累引文。平均而言，科学论文在发表后的2~5年内达到引用的高峰，这使得用引文数来评估科学家最新工作的影响是不切实际的。因此，在许多科学领域，有声望的学术期刊已经成为科学合法性的守门人。学术期刊的主要作用是选择和发表重要的科学贡献。筛选过程是基于编辑的决定，即哪些投稿属于期刊的范围，并且“足够好”，可以通过同行评审进行详细评估。如果一篇文章引起了编辑的兴趣，编辑就会决定邀请谁来审查该论文。根据这些审查，编辑会做出最终决定，决定是否对一篇文章录用、拒绝或提出修改意见。因此，知名期刊的编辑和审稿人在科学界有很大的影响力。衡量期刊声望的最突出的指标是其影响因子，即过去两年发表的文章的年平均引用次数。影响因子是一个衡量标准，将一个期刊上发表的所有论文的声誉集中起来，而不考虑其实际的个人质量和影响。然而，期刊内部的引文分布通常是高度倾斜的——期刊中大约一半的可引用论文往往占到期刊总引文的85%。由于在同一期刊上发表的文章在引用模式上的巨大差异，因此影响因子只是一个非常粗略的方式。此外，小型期刊的影响因子对收录一篇或几篇迅速积累大量引文的文章可能非常敏感。不同领域的期刊影响因子也有很大差异，部分原因是普遍的引文文化和一个学术学科的绝对规模，但也与期刊规模和出版物类型(如信件、社论、新闻条目、评论)相关。因此，期刊的影响因子有时与其发表的文章质量无关。传统学术期刊要求作者将版权转让给出版商。版权是一种知识产权，赋予其所有者复制创造性作品的专有权，从而为版权所有者创造垄断权力，使作品货币化。学术出版物市场主要由五家大型营利性公司(Elsevier、Black & Wiley、Taylor & Francis、Springer Nature和SAGE)主导，它们共同控制着50%以上的市场。全世界学术论文使用权的销售额超过190亿美元，这使得学术出版业的收入介于音乐产业和电影产业之间。出版公司的两种主要商业模式是“付费获取”和“付费出版”，这两种模式都依靠科学家无偿的同行评审，这相当于科学家向出版业捐赠了数十亿美元，出版社利用公共资金或研究人员的私人时间来提高利润，并剥夺了科学家进行高质量评审工作的应有的公平回报。近年来，我们见证了免费替代方案的兴起：预印本平台(如bioRxiv、medRxiv或SSRN)，它们允许科学家在网上发布其手稿的早期版本。这些预印本平台效仿物理学家依靠Arxiv在圈子里分发自己工作成果的做法。与此类似，经济学家也依赖NBER等工作文件平台，主要是因为在知名的经济杂志上发表文章往往需要多年时间。然而，预印本和工作论文没有经过同行评审，往往与最终发表版本大相径庭，或者根本没有被需要同行评审的期刊接受发表。因此，非专业的读者很难/不可能评估他们能否相信这些渠道的内容。正如我们在COVID疫情中所看到的，预印本平台，尤其是在医学领域，可能被滥用于传播错误信息和不可靠的科学研究。最近的一波浪潮是Web3技术，该技术实现了互联网的去中心化版本，其基础是越来越多的公开可用、防篡改记录的对等网络，允许大规模协作。Web3是对Web2的中心化、不透明、数据篱笆原则的有力背离。Web2是注意力经济，也是Facebook、Google等公司成功的基础，也是寡头垄断的学术出版商的专有、垂直整合的平台。与此相反，Web3的核心前提是将所有权广泛地分配给用户，以及通过分布式账本技术构建无需信任、抗审查的执行代码。随着Web3越来越多被采用，应用程序也越来越多。 Web3的核心承诺是，通过利益相关者的激励协调，以无信任、抗审查的方式执行代码，并通过点对点的网络进行协调，将价值广泛地重新分配给用户。建立在这些网络之上的是去中心化的自治组织(Decentralized Autonomous Organization, DAO)，即由贡献者和活跃用户组成的社区，他们通过共同拥有和共同管理这些网络进行合作。Web3原生的互操作数据模型，如IPLD，结合存储激励层(如Filecoin)，可以使每个人都能永久地获得科学。Web3上的持久性标识符(PID)被内容标识符(CID)取代。与PID不同的是，CID是加密的，以提供对其基本内容的防篡改映射。与DOI(出版业的PID和主键)不同，Web3的CIDs可以随意发布，不受链接失效的影响，并且不受内容漂移的影响，其维护成本很高，并且依赖于由出版业控制的集中式机构。从Web2PIDs到Web3CIDs的转变将是一个范式的转变，我们有能力产生丰富的、相互关联的、不可改变的知识图谱(CID-图谱)，并从这些关系中自动生成丰富的科学元数据。这样的Web3知识图谱将揭示研究领域内的联系的新信息。当前最知名的Web3示例是NFT。这些不可替代的代币( Non-Fungible Token，NFT)为用户提供了区块链中各个条目使用加密货币购买的数字资产的所有权证明。许多出版商(如《南华早报》、《时代》、《甘尼特》和《经济学人》)都成功地尝试了创建NFT。 2022年3月，《南华早报》通过13 000个NFT发布自1997年以来的所有历史性“头版”故事筹集了250 000美元。这些NFT的销售和包装具有创新性和战略性，因为它们随机包装在价格相同的神秘盒子中。每个盒子里有五件藏品，所有的NFT盒子在5小时内售罄。幸运的收藏家获得了极为罕见的首页，他们可以将其添加到收藏品中或转售以获得可观的利润。在Web3应用于科学的领域，一些先驱者已经开始行动。现在已经有了一个生态系统，VitaDAO是一个范例，它将世界上一些研究实验室聚集在一起，为他们的研究提供资金，并对由此产生的知识产权拥有权益。其他项目，如ResearchHub，正试图通过类似Reddit的社会机制，对科学工作进行众包策划。原文题目：1. osblockchain 智编专家公众号：Web3技术将为学术出版带来新的变革； 2. Web3 for news publishers: What's the long-term potential? 3. 学术出版市场为何需要用Web3技术重构? 原文链接：1.https://mp.weixin.qq.com/s/AG8EHH4Cl4TUp1VJj-2HVQ； 2.https://whatsnewinpublishing.com/web3-for-news-publishers-whats-the-long-term-potential/；3.https://www.zilian8.com/870083.html

展开更多

238浏览量

0点赞

收藏

原文链接
《WAME 关于与学术出版物相关的 ChatGPT 和聊天机器人的建议》
- 来源专题：科技期刊发展智库
- 编译者：郭林林
- 发布时间：2023-03-31
- WAME提出关于使用聊天机器人的建议，旨在帮助他们为自己的期刊制定有关聊天机器人的政策，帮助作者了解如何在其成果中使用聊天机器人，并满足所有期刊编辑访问稿件筛选工具的需求。聊天机器人是一种“在人工智能、自动规则、自然语言处理(NLP)和机器学习(ML)的驱动下，处理数据以响应各种请求”的工具。人工智能(AI)广义上指的是能够以类似人类的方式学习和决策的计算机。近年来，聊天机器人已经被许多公司使用，包括医疗保健公司，用于提供客户服务、路由请求或收集信息。 ChatGPT是最近发布的一款聊天机器人，它“是生成型人工智能的一个例子，因为它可以创建以前从未存在过的全新内容”。在某种意义上，它可以使用新的方式组织现有信息。ChatGPT有很多潜在的用途，包括“例如，总结长篇文章，或制作一份演示文稿的初稿，然后再进行调整。”它可以帮助研究人员、学生和教育工作者产生想法，甚至可以就某一特定主题撰写质量合理的论文。因此，大学不得不改变教学方式。 ChatGPT具有许多限制，正如其创造者承认：“ChatGPT有时会写出看似合理但不正确或荒谬的答案……理想情况下，当用户提供模棱两可的查询时，模型应当提出明确性的问题。相反，我们当前的模型通常会猜测用户的意图……尽管我们努力使模型拒绝不适当的请求，但有时它会对错误的指令做出反应或表现出不恰当行为。“而且，“与谷歌一样，ChatGPT不会在网上搜索当前事件的信息，其知识仅限于2021之前所学的内容，这使得一些答案显得过时。”OpenAI目前正在开发一个改进版本，“比以前的版本更擅长生成文本”，其他几家公司正在创建自己的“生成AI工具”。聊天机器人使用现有文本库进行“训练”。因此，响应操作员的特定输入（“问题”或“种子文本”），聊天机器人会以“答案”或其他输出做出响应。最终，该输出包括根据算法调整的训练材料的选择。由于聊天机器人没有意识，它们只能重复和重新排列现有的材料。它们的内容中没有新的思想：它们只能是偶然的原创。由于聊天机器人利用了他们接受过培训的现有文本库，因此在某些情况下，他们可能会逐字逐句地重复这些文本，而不会透露其来源。根据最近一份使用ChatGPT生成文本的预印本，“直接从ChatGPT获得的初步文本中正确引用的百分比仅为6%。”，因此，如果聊天机器人的输出内容要在学术期刊上发表，为了避免抄袭，人类作者和编辑必须确保文本包含完全正确的参考文献，其程度与人类作者的要求完全相同。聊天机器人不是法律实体，也没有法律人格。一个人不能以任何方式起诉、传讯或惩罚聊天机器人。使用软件的公司发布的许可文件中规定了使用条款和使用软件结果的公认责任。此类文档与被其他书写工具（如Word、PowerPoint等）生成的文档类似。正如微软对使用Word编写的任何内容不承担任何责任一样，ChatGPT的创建者OpenAI对使用其产品生成的任何文本不承担任何责任：其使用条款包括赔偿、免责声明，以及责任限制。只有ChatGPT的用户可能会对其所犯的任何错误负责。因此，将ChatGPT列为作者（这已经在发生，甚至被鼓励）可能是错误的，在法律上是不可辩护的。虽然ChatGPT可能被证明是对研究人员的有用工具，但它对学术期刊构成了威胁，因为ChatGPT生成的文章可能会在已发表的文献中引入虚假或剽窃的内容。同行评审可能无法检测到ChatGPT生成的内容：研究人员很难区分ChatGPT产生的摘要和作者撰写的摘要。那些最了解该工具的人很警惕：一个大型人工智能会议禁止在会议论文中使用ChatGPT和其他人工智能语言工具。从另一个角度来看，聊天机器人有助于制作欺诈论文；这种行为违背了科学哲学。可能会有人认为，聊天机器人的使用与papermill差别很小——尽管后者显然有欺骗的意图，但对于聊天机器人的应用来说不尽然。然而，人工智能能够帮助生成错误的想法，这一事实本身就不科学，也不可靠，因此编辑们应该感到担忧。与此相关的是，2022年还发布了DALL-E 2，这是另一个基于ML的系统，可以根据OpenAI提交的自然语言文本描述创建逼真的图像和艺术，OpenAI是制作ChatGPT的同一家公司。最近，谷歌还发布了一款名为Imagen的类似产品。这些工具也引发了与ChatGPT类似的担忧。有趣的是，使用DALL-E2生成的每个图像都在右下角包含一个签名，以说明图像的来源；然而，这个标签可以被网络搜索到的几个简单方法中的一种很容易地删除。随着ChatGPT和DALL-E2的出现，以及更多工具的出现，编辑们需要制定使用此类技术的期刊政策，并要求工具能够检测其生成的内容。针对作者的学术出版指南应根据不同群体的意见制定，包括第一语言不是英语的研究人员。这可能需要一些时间。同时，我们为编辑和作者提供以下建议。 WAME建议: 1.聊天机器人不能是作者。聊天机器人无法满足成为作者的要求，因为他们无法理解作者的角色或对论文负责。聊天机器人无法满足ICMJE的作者标准，特别是“最终批准将要发布的版本”和“同意对作品的所有方面负责，以确保与作品任何部分的准确性或完整性相关的问题得到适当调查和解决。”聊天机器人无法理解利益冲突声明，或具有签署声明的法律地位。聊天机器人没有独立于其创建者的从属关系。他们不能持有版权。提交手稿的作者必须确保所有被命名为作者的人都符合作者标准，这显然意味着聊天机器人不应被视为作者。 2.当使用聊天机器人时，作者应该是透明的，并提供有关他们如何使用的信息。由于该领域目前发展迅速，使用聊天机器人帮助撰写论文的作者应声明这一事实，并在提交的论文中提供所用聊天机器人的完整技术规范（名称、版本、模型、来源）和应用方法（查询结构、语法）。这与ICMJE关于承认书面协助的建议一致。 3.作者对聊天机器人在其论文中所做的工作（包括所呈现内容的准确性，以及没有抄袭）负责，并对所有来源的适当归属（包括聊天机器人制作的内容）负责。借助聊天机器人撰写文章的人类作者对聊天机器人的贡献和其准确性负责。他们必须能够确定他们的论文包括聊天机器人产生的文本没有抄袭。人类作者必须确保所有引用的材料都有适当的属性，包括完整的引用。他们应该声明聊天机器人使用的特定查询函数。作者需要寻找并引用支持聊天机器人生成的内容来源。由于聊天机器人可能被设计为忽略反对其输出中表达的观点的来源，因此作者有责任查找、审查并在其文章中包含此类观点。 4.编辑需要适当的工具来帮助他们检测人工智能生成或更改的内容，无论他们是否能付费，这些工具都必须可用。许多医学期刊编辑使用20世纪的手稿评估方法，但现在发现自己面对的是21世纪的人工智能创新和行业，包括被篡改的抄袭文本和图像以及papermill生成的文档。他们在试图将合法的与捏造的区分开来时已经处于劣势，像ChatGPT这样的聊天机器人将这一挑战提升到了一个新的水平。编辑需要访问帮助他们高效准确地评估内容的工具。通过STM工作的出版商已经在开发这样的工具。为了科学和公众的利益，无论编辑是否有能力支付这些工具，都应该向他们提供这些工具。通过将其纳入开源出版软件（如公共知识项目的开放期刊系统），以及关于筛选输出的使用和解释的培训，将使自动筛选提交的稿件成为许多编辑翘首以待的现实。
  
  展开更多
432浏览量

0点赞

收藏

原文链接

《基于共引网络的出版物影响力评价新指标：相对引用率》

《 Web3技术将为学术出版带来新的变革》

《WAME 关于与学术出版物相关的 ChatGPT 和聊天机器人的建议》