...

《数智化图书情报监测快报》

  • 来源专题:数智化图书情报
  • 编译类型:快报,简报类产品
  • 发布时间:2024-01-20
数智”赋能正逐步成为推动图书情报领域创新发展的新动力,大数据+人工智能等新技术为图书情报领域发展带来了新机遇,数智化图书情报监测快报聚焦大数据、人工智能等技术在图书情报领域应用现状,跟踪最新研究成果,为领域研究人员提供信息支撑。
  • 1. 2025年约翰·科顿·达纳奖聚焦图书馆营销领域的创新成果
    王江宁
    (马萨诸塞州伊普斯维奇,2025年6月27日)2025年约翰·科顿·达纳奖(John Cotton Dana (JCD) Award)的获奖者已揭晓,该奖项旨在表彰在战略传播方面表现卓越的图书馆。该奖项由美国图书馆协会(ALA)的核心部门与EBSCO公司合作举办,由H. W. Wilson基金会提供高达8笔1万美元的资助。这些奖金旨在表彰那些提升图书馆服务的知名度和影响力的杰出公关工作。 2025年JCD奖得主为: “希望之弦”芝加哥:埃尔金联合项目——盖尔·博登公共图书馆,伊利诺伊州埃尔金市 从2022到2024年,盖尔·博登公共图书馆区举办了“希望之弦”展览,这是一场极具影响力的乐器展览。通过表演、活动和合作,该活动传播了希望、团结和文化包容的信息。该项目通过艺术手段增强了社区的意识和同理心,产生了深远的影响。 出示您的借书证并享受优惠:2024年图书馆卡注册月——汉密尔顿东区公共图书馆,印第安纳州诺布尔斯维尔 2024年,图书馆启动了一项重新策划的“图书馆卡注册月”活动,旨在与有关参与度和增加会员数量的战略目标相契合。通过利用社区合作关系、人口统计信息以及读者反馈,该活动旨在提高公众对图书馆全方位服务(尤其是非传统服务)的认识,并与新的和不断扩大的受众群体建立联系。 欢庆时刻:哈特福德公共图书馆250年的历史回顾——康涅狄格州哈特福德市,哈特福德公共图书馆 2024年,哈特福德公共图书馆迎来了其250周年庆典,开展了为期一年的系列活动,以纪念其历史并重新诠释其在社区中的不断演变的角色。活动亮点包括推出新品牌、全市范围内的寻宝活动、游行、定制酿造的啤酒募捐活动以及经过大规模翻新的市中心图书馆的重新开放。通过富有创意的活动安排、社区参与以及屡获殊荣的营销策略,哈特福德公共图书馆展示了其持久的影响力和对未来的愿景。 斯普林湖地区图书馆更新项目——斯普林湖地区图书馆,密歇根州斯普林湖 为满足不断变化的社区需求而启动的“图书馆更新项目”对图书馆空间进行了重新设计,旨在优先打造私密的学习区域和充满活力的交流场所。通过为期18个月的内部营销活动,图书馆营造了浓厚的氛围、实现了透明度,并赢得了信任。该活动的成功体现了图书馆与社区的紧密联系以及其致力于保持与时俱进和包容性的决心。 “全免费”运动——斯托-芒罗福尔斯公共图书馆,俄亥俄州斯托市 由于意识到公众对图书馆的数字服务缺乏了解,图书馆的外展团队发起了“全部电子资源,全部免费”的活动,旨在强调只要拥有图书馆卡,所有的电子媒体资源(包括电子书、有声读物和流媒体服务)都是完全免费的。这一活动源于一个贴近生活的契机,并由有策略的外展活动推动,其目的是改变人们的观念,让整个社区都能觉得获取数字资源的过程简单、包容且具有激励性。 《大故事小书》——社区图书馆,爱达荷州凯彻姆 社区图书馆推出了《大故事小书:爱达荷州图书馆之书》这一活动,旨在展示爱达荷州各地读者的真挚心声,以此来颂扬社区对图书馆所给予的深厚信任和重视。该活动旨在强调开放获取文学的重要性,以及爱达荷人具备的同理心、对话能力和相互理解的能力。通过讲故事的方式,该活动进一步强化了图书馆在公民生活中的持久作用。 “125周年,让我们一同庆祝!”——西蒙特公共图书馆,加拿大魁北克省西蒙特市 为了庆祝西蒙特公共图书馆成立125周年以及西蒙特市成立150周年,该图书馆于2024年发起了一项为期一年的活动,该活动的灵感来源于杰出的图书馆馆长玛丽·萨克斯。在市议会的支持以及一个专门的周年纪念委员会的协助下,这项活动突显了图书馆的历史遗产,加深了社区的参与度,并确保了对活动和服务的包容性访问。该活动不仅纪念了图书馆的影响,还为未来的建设奠定了基础。 “猫猫三月”:一场由社区主导的图书馆宣传/互动活动——伍斯特公共图书馆,马萨诸塞州伍斯特市 2024年3月,伍斯特公共图书馆启动了“猫猫三月”活动,这是一项由社区主导、充满趣味性的举措,旨在消除使用图书馆资源的障碍,通过免除费用并要求提交猫咪照片来实现这一目标。该活动旨在减轻歧视现象,并重新吸引用户,特别是那些来自边缘化社区的用户,他们的账户曾因丢失或损坏物品的费用而被封锁。通过将费用减免转变为一种有趣且包容的体验,图书馆强化了其对无障碍性和社区联系的承诺。 2025年JCD获奖者将于2025年ALA年会期间揭晓。如需了解更多信息及有关典礼的详情,请访问JCD网站。 ### 2025年评审委员会 今年的评审小组成员包括:马莎·安德森,阿肯色大学组织发展部主管兼数字服务部门负责人;珍妮·布兰登,密歇根州立大学图书馆的图书管理员/网页设计师;特丽·卡罗尔,托莱多卢卡斯县公共图书馆的传播、设计和分析部门主管;萨拉·尼尔,盐湖县图书馆的营销和传播经理;评审主席凯利·西茨曼,先锋图书馆系统的传播与员工发展部主管。 关于约翰·科顿·达纳奖(JCD) 约翰·科顿·达纳奖由H.W.威尔逊公司于1946年在美国图书馆协会的年度会议上设立。该奖项以约翰·科顿·达纳(1856-1929)的名字命名,他是被誉为现代图书馆之父的图书馆管理员。该奖项的资金由H.W.威尔逊基金会提供。 关于H.W.威尔逊基金会 该基金会由哈立斯·W·威尔逊于1952年创立,旨在满足公司员工和退休人员的需求。自1957年以来,H.W.威尔逊基金会一直致力于通过援助、支持以及与慈善、慈善机构、教育机构和宗教机构的合作,为对改善最多人的精神、心智和身体状况具有最大影响的事业提供资金援助。该基金会的主要捐赠者包括哈立斯·W.威尔逊夫妇以及H.W.威尔逊公司。 关于Core:领导力、基础设施与未来 Core:领导力、基础设施、未来是全国性的协会,致力于推动图书馆员和信息提供者这一职业的发展,其核心职能包括领导与管理、馆藏与技术服务以及技术应用。我们的使命是通过社区建设、倡导和学习来培养并提升图书馆工作人员在核心职能方面的集体专业能力。Core是美国图书馆协会的一个分支机构。请关注我们的博客、Instagram或LinkedIn账号。 关于EBSCO EBSCO信息服务公司(EBSCO)是全球领先的在线研究内容及前沿搜索技术提供商,为世界各地的图书馆、医疗保健和医疗机构、企业以及政府机构提供服务。作为一家具备人工智能能力的服务提供商,EBSCO提供从研究、采购管理、订阅服务和发现服务到临床决策支持和患者护理、学习、研究与开发等全面解决方案。凭借对人工智能驱动创新的承诺,EBSCO走在行业前沿,使我们能够满足信息服务领域不断变化的需求。欲了解更多信息,请访问EBSCO网站:www.ebsco.com,或者访问博客EBSCOpost,或关注X、Facebook、LinkedIn和Instagram。

    发布时间: 2025-07-23

  • 2. 临床科研场景下医疗数据共享路径研究
    程冰
    [目的/意义]通过分析临床科研场景下医疗数据共享的总体架构和路径,构建和完善医疗数据共享的理论框架,为医疗数据资源的充分利用提供指导。[方法/过程]采用理论分析法,基于数据价值链理论构建临床科研场景下医疗数据共享的总体架构。结合价值共创理论探索医疗数据控制者、使用者、处理者和监管者协同参与的数据共享路径,进而展开国内外多案例比较。[结果/结论]打造由“数据资产化”到“数据商品化”,再到“数据资本化”的整体方案,形成“控制者数据发布—处理者数据传输—使用者数据获取—监管者共享监督”的共享路径,分析提出数据共享的开放性与限制、数据安全性与隐私保护、数据共享的流程与效率方面的完善策略。

    发布时间: 2025-07-22

  • 3. 数智赋能标准情报服务创新:内在逻辑与实现路径
    闫亚飞
    在数智为王的时代,大数据提供了助推标准情报服务创新的新思维、新手段,已成为标准情报工作提质增效的新利器。 以构建高质量的标准情报服务模式为价值目标,在明晰数智赋能标准情报创新内在逻辑的基础上,按照价值效益的需求,有必要进一步探究新形势下服务创新发展的具体实现路径,以推动标准情报服务创新过程稳定有序开展,充分发掘服务价值增长的新动能。 1. 数智赋能标准情报服务创新的实现机理 数据作为数智化的核心资源要素,是发挥标准情报服务价值的基础,然而数据孤岛与数据碎片化问题却成为制约服务效能提升的沉疴痼疾。 如何梳理和整理标准情报数据,使之体系化、规范化,并将整个链路打通为完整闭环,便成为标准情报服务创新转型的价值诉求所在。 随着数智化在标准情报服务领域不断深入,亟需依靠数智赋能对海量标准情报数据进行深度挖掘,以发现数据之间的关联规律,充分释放数据流来催生新的服务价值。 事实上,让数据说话,以数据为引领的标准情报服务可以更有效地协调各种资源,并通过数据对情报行为和要素的作用进行预判,从而实现快速迭代和调节。 因此,以“数据即服务”为路径导向,本文对数据要素价值转化的全生命周期过程展开分析,以阐明数智赋能标准情报服务创新的实现机理。 a.数据采集,即从数据源收集、识别和选取数据的过程。 该模块运用埋点、探针、爬虫等技术与设备进行数据交互,从资源池广泛读取标准情报生产数据,并将不同资源池中分散、零乱、标准不统一的源数据予以汇聚,批量而精确地采集和抽取用户所需的结构化、半结构化和非结构化数据,最终将其转化为结构化记录,保存至本地标准情报数据库中。 b.数据预处理,旨在对所采集汇总的原始数据进行清洗、抽取、转换、消减及集成等系列操作,通过人工或 AI 方式进行相应加工处理,以提取可用的价值数据和业务数据,从而初步形成标准情报数据资产。 同时,借助数据目录对已采集的结果数据予以多维多层级分类展示,并编辑和删除不合格的数据信息,这可在保障数据标准化和规范化的基础上提高标准情报数据质量,为上层业务提供数据支撑。 c.数据存储与计算,即将可用数据以稳定可靠的结构存储下来,并对其进行全面的统计分析,通过一定模式计算得到标准性能、标准专利、知识产权等多种符合用户需求的数据要素,以供后用。 在不同的标准情报数据应用场景,借助全面的复杂数据分析和计算能力,在全流程上实现资源动态调配,大大提高了资源利用率,实现了高效的情报数据价值转化。 d.数据应用,进入价值变现阶段,以明确的标准情报需求为导向,支持用户对情报数据的多维度多衍生穿透性分析,以准确及时掌控标准的技术和市场倾向动态。 在挖掘数据深层价值的基础上,面向用户提供标准跟踪、研究、咨询、对比等针对性服务,为标准化战略决策制定提供精准可靠的数据支撑,最终实现为标准情报服务的数智化赋能。由此可见,盘活标准情报数据资产,使其为业务管理、运营、决策服务,便是数智赋能标准情报服务创新的价值实现机制。 以数智化技术为依托,聚焦于数据深耕与数据价值挖掘,从数据的采集、处理到数据的分析,再到数据的应用与咨询,层层把控、环环相扣,完成了数据资产化、要素化和价值化的蜕变。 通过数据资源的实时动态更新,标准情报服务亦可不断进行自我进化,始终保持着旺盛的创新生命力。 2. 数智赋能标准情报服务创新的实现路径 数智赋能是标准情报服务持续革新的内在驱动力,是聚集情报数据合力、满足用户多变的定制化服务需求的重要手段。 伴随着情报数据在不同主体间的双向流通、深度融合,数据价值得以充分挖掘、培育和释放,随之联结为全链条无缝衔接的反馈闭环,全方位打通了端对端的数智化应用场景,并为标准情报服务创新落地提供了可行路径,其中涵盖了服务数据化、数据服务化和再循环三个阶段。 a.服务数据化,即服务在线,标准情报服务流程信息化,运用标准情报服务平台承载服务流程。遵循面向情报服务的组件化开发和技术架构设计理念,基于 对用户需求的深刻理解来打造集多源异构数据接入、整合、交换、共享于一体的开放式情报数据服务平台,以实现同构、异构系统之间的数据抽取、格式转换、内容过滤、同异步传输、数据整合存储、数据共享等功能。由此,在保持服务流程优势的同时,不同业务系统间的情报信息可灵活交换、共享与协同,辅助用户以迭代的方式不断完善和扩充信息资源体系,实现了标准情报服务流程的优化与再造。以国家标准文献共享服务平台为例,该平台便提供按行业、按领域、按主题的国内外标准专题数据库,且数据项服务可按照用户需求定制,以便让用户及时了解和掌握所关注领域的最新标准信息或标准制修订活动情况,为产品研发和相关研究提供支撑。 b.数据服务化,即数字智能,将数据分析结果反馈 至情报系统,形成面向业务、面向管理、面向决策、跨具 体业务系统的全局性多角度资源视图,支持用户以多视角观察和发现数据中蕴含的联系和规律,从而为业务管理、标准研判及其战略决策提供详实可靠的参考依据,并为跨部门、跨业务系统的全局性信息资源共享交换和业务协作提供支持。在数据资源整合与综合利用的推进过程中,为各级各类用户提供完整、及时、准确的标准情报数据服务,全面满足用户对于情报数据使用的个性化需求,可将情报数据快速转化为价值生产力,使其在复杂业务场景中迸发出更高价值。国家标准文献共享服务平台设有标准研制贡献大数据分析系统,可从时间、地域、起草单位等维度,实时、动态、可视化地展示标准研制情况,并撰写标准大数据分析研究报告,从而帮助用户全方位、多视角了解标准工作的全貌。 c.再循环,即通过数据沉淀与数据应用,及时收集回笼信息对数据质量进行评估,对数据进行反复打磨,以促进下一次的挖掘优化,达到服务产生数据、数据反哺服务的增量闭环。在此闭环循环过程中,以提高质量效益为中心,将情报数据转化为用户需求洞察,进而由洞察产生行动,这不仅在技术上提升了洞察分析能力,也可在组织、管控、能力等方面同步得到精准提升,确保了“感知→洞察→评估→响应”闭环的顺利运行 并得以循环提升,最终为用户提供全链路的高效标准情报服务,使数据成为推动标准情报服务高质量发展的有力支撑。同样地,经由数据导入与更新、数据加工与内容挖掘、指标自动抽取与人工校对等环节,国家标准文献共享服务平台完成了标准情报信息的全流程管理,为用户提供了标准信息的全流程服务,切实增强了自身的可持续发展能力。

    发布时间: 2023-07-11

  • 4. IFLA:人工智能对图书馆的影响及图书馆应对策略
    杨小芳
    人工智能对图书馆的影响 人工智能可能对图书馆工作产生“广泛而深刻”的影响。 从下表1中我们可以看到,人工智能对图书馆诸多服务产生影响,有些带来根本性的改变,有些只带来微小的变化。预计图书馆将以符合现有角色、与用户需求紧密相关或需要最少资源的方式来应用人工智能。 表 1 人工智能对图书馆运营的影响 我们已经强调了描述性人工智能与提高图书馆馆藏可访问性之间的紧密联系。人工智能技术被应用于生成初始元数据,此技术有望在搜索引擎中发挥作用,并助力综述的某些环节(如结果筛选)。 随着越来越多的学者在研究中使用人工智能技术,对数据科学家社区的支持需求也将增长。图书馆可以在数据发现、版权问题、数据管理和数据保存方面提供支持。 人工智能可能会改变日常的知识工作,例如自动翻译、摘要和文本生成。大量人工智能工具和应用程序可以应用于图书馆专业工作。例如ResearchRabbit、Scite、elicit和openread等工具有助于文献综述。生成式人工智能在图书馆宣传中得到了应用,因为其具备根据特定受众需求调整文本的能力。 因为人工智能能够准确执行复杂的常规性任务,故而具备了在图书馆后端系统中应用的可能。例如,采用机器人流程自动化(RPA)技术处理书目数据,便是一个典型的应用场景。 鉴于图书馆接受的咨询量大,图书馆已倡导采用聊天机器人多年。聊天机器人因为其技术障碍降低而变得可行。聊天机器人可承担如下职责: 回应常规问题 收集用户信息  遵循标准流程提供用户支持 成为新用户的伙伴 人工智能技术将被应用于打造更智能的图书馆空间。一些图书馆已研发了实体机器人用于读者咨询,机器人还被用于执行上架和盘点等任务。此外,已有图书馆采用自动存储与检索系统(ASRS),可以根据需求检索馆藏。通常,此类应用需开展大规模的重建工程。 对于学校图书馆而言,其他人工智能在教育领域的应用,如自适应学习内容创建或聊天机器人等,皆与其相关。(Jisc,2023b)。 因用户的广泛使用,生成式人工智能成为了讨论的焦点,这使得教职员工和学生需要具备一定的人工智能素养(包括数据和算法素养)。图书馆有责任推广信息素养和数字技能。人工智能素养涵盖对人工智能各种表现形式的理解,涉及“批判性评估人工智能技术;与人工智能进行有效沟通与协作;以及在网络、家庭和工作场合运用人工智能作为工具”(Long and Magerko,2020)。 人工智能素养在未来职场中显得至关重要;运用人工智能或与其协同工作的技能案例不断涌现;而其具体实施方式可能因不同学科领域而有所差异。 人工智能也可以应用于预测用户行为模式,从而辅助决策制定。 下表调查结果显示了在撰写本文时的AI发展水平。人工智能素养已迅速成为关注的焦点。(编者注:此为根据111份样本调查数据的结果;受访者包括高等教育和继续教育图书馆员,主要来自英国。) 表 2 图书馆计划中、试点和成熟应用的人工智能服务 如何更新资料以跟上人工智能不断变化的特性? 哪些应用需求资源最少且最符合用户需求和现有图书馆角色? 哪些发展对重塑图书馆角色最为关键? 哪些最有可能发生,在多长时间内发生? 人工智能技术如何提升图书馆服务?人工智能能帮助解决哪些挑战?潜在的风险和伦理考虑是什么,如何减轻这些风险? 如何持续关注并及时了解新兴的人工智能的趋势和进展? 图书馆如何有效地培养用户人工智能素养? 需要哪些关键的学习成果,在各个学科中的差异性如何? 随着人工智能发生变化,教材应如何更新? 三个重要策略 鉴于人工智能影响的广泛性,图书馆可以采取多种策略以应对。 以下列举三项重要策略建议。 策略一:利用图书馆的AI能力,构建负责任且可解释的描述性AI应用 在拥有大量需要改进资源描述的特色馆藏的情况下,图书馆可以应用描述性AI来创建符合伦理、负责任和可解释的AI的范例,以对抗大科技公司的产品((Lee, 2023; Padilla et al., 2023)。这可以通过遵循良好治理原则来实现,比如: 揭示馆藏的来源,以便使用者全面了解信息来源的性质; 确保应用人工智能的馆藏选择是适当的,考虑到技术和版权问题,同时尊重包容性、土著权利和非殖民化问题;尊重那些在收藏中被代表的人以及所有其他利益相关者的权利;适当奖励/认可志愿者和众包工作者;尊重知识产权问题,例如藏品中的版权/内容许可; 使服务对目标用户易于使用、可访问且可解释; 充分记录项目以确保可解释性; 尽可能公开地共享代码、训练数据、工具包等; 从可持续性角度评估项目,包括环境影响的角度 实现这一目标仍然存在许多挑战,例如如何: 考虑优先应用人工智能的馆藏 评估经济可承受的现成工具是否适用于图书馆馆藏历史数据 解决概念性挑战,例如如何对图像进行分类 将概念验证项目转化为可持续服务 策略二:利用图书馆员的数据能力增强组织的AI能力 并非所有图书馆都拥有需要使用人工智能的馆藏,但图书馆员在的数据相关领域的专长对于机构应用人工智能具有较高价值,因为当今的人工智能是数据驱动的。 这种专业知识可以支持图书馆所在的更广泛组织内的数据科学家,如学术环境中的多学科社区数据科学家,或在卫生服务或政府机构分析数据的分析师。相关行为包括: 在复杂的信息环境中寻找数据源 推广数据共享、开放性和互操作性的价值 解释数据来源、有效性和质量的重要性,以了解如何适当使用该数据 根据版权、知识产权等解释哪些数据可以使用,哪些不可以 使用标准描述数据及其价值 存储、保存(或销毁)数据 所有这些做法都符合信息治理和管理的专业知识,但需要将这些知识转化到数据领域。 策略三:推广人工智能素养以提升组织和社会的AI能力 在推广人工智能素养方面发挥领导作用,是最符合现有图书馆实践和图书馆员身份的策略,特别是在大学、学校和公共图书馆中。人们普遍认识到,公众作为公民和从业者需要了解新技术。各个专业的学生都需要这样的知识来提高就业能力。 图书馆员已经开发了信息素养项目,人工智能某些方面素养可以纳入其中。他们已经发展了所需的教学知识和技能。 人工智能素养可能包括识别人工智能何时被使用的能力;理解狭义人工智能和通用人工智能之间的差异;了解人工智能擅长解决哪些类型的问题;了解机器学习模型如何训练。另外还包括对诸如偏见、隐私、可解释性和社会影响等伦理问题的认识。 由于人工智能基于数据,因此数据素养被认为是人工智能素养的组成部分。算法素养是一个已经发展起来的概念,用于描述搜索和推荐等服务如何越来越多地由算法塑造,以使内容个性化,但也可能限制信息的可见性并产生信息茧房效应。更正式地说,它被定义为“了解在线应用、平台和服务中算法的使用,了解算法的工作原理,能够批判性地评估算法决策,以及拥有应对甚至影响算法操作的技能”(Dogruel et al, 2022: p.4)。将算法素养扩展到搜索范畴之外与人工智能素养相关。 人工智能很复杂且难以解释。它有多种应用和形态。它基于难以理解的计算思想和统计数据。通常即使是人工智能的设计者也难以理解人工智能作出的决策结果,因为机器从数据中学习模式。虽然一些人工智能的形象让我们期望去使用一个明确的AI服务(如ChatGPT),但实际上它通常嵌入在基础设施中,不容易识别或抵制。的确,可以公平地说,大型科技公司不一定希望人工智能的工作方式为人所知,因为这是商业机密。

    发布时间: 2024-10-31

  • 5. 数据交易市场流转机制的系统动力学分析
    程冰
    [目的/意义] 为探讨数据交易市场中各个要素的动态变化及其相互作用,揭示数据交易对市场和社会经济的影响机制,探索更有效的管理和交易模式。[方法/过程] 采用系统动力学方法,探索数据交易市场中的数据流转机制及其动态性,将数据交易市场细分为数据资产管理、交易机制、监管与合规以及市场动态4个核心子系统,并通过Vensim PLE软件进行情景仿真,以深入探讨各子系统间的相互作用及其对市场整体性能的影响。[结果/结论] 通过对数据交易市场的系统性分析,揭示数据流转中的关键驱动因素和核心问题,提出促进市场健康发展的策略建议,为相关政策制定和市场实践提供参考。

    发布时间: 2025-07-23

  • 6. LIBER和ADBU发布关于研究型图书馆内开放科学服务的联合报告
    程冰
    研究目的 欧洲的许多研究图书馆在研究数据管理(RDM)和开放获取(OA)领域提供开放科学服务。然而,约有多达一半的欧洲研究图书馆在这些领域仅提供有限的服务。这项LIBER/ADBU研究的重点是了解这些服务所需的组织结构和能力,以支持整个欧洲的研究图书馆通过本研究的工具包加速采用以上两项开放科学服务。 科技资源开放共享的浪潮正在改变我们获取和传播科研信息的方式。在这一背景下,变革期刊(Transformative Journals, TJ)模型被设计出来,以帮助订阅型出版商成功过渡到全面并即时的开放获取(Open Access,OA)。近日,cOAlition S发布了关于2022年变革期刊进展的数据报告,这是一次深入理解模型运作情况的机会。 研究方法 本研究采访了在这些领域拥有发达和/或先进支持服务的图书馆。基于这些访谈,报告描述了RDM服务的四个发展阶段及其所需的相关组织结构和能力、OA服务的三个发展阶段。RDM支持服务图书馆旨在为研究人员提供涵盖整个数据生命周期的RDM支持服务和基础设施。数据生命周期由三个阶段组成:(1)研究项目的准备以及数据管理计划(DMP);(2)使用所谓的“活动数据”执行研究;(3)发布/归档结果数据集的最后阶段。为了创建在整个数据生命周期支持研究人员的服务组合,图书馆与其他内部利益相关者(例如IT部门、研究办公室、数据保护官员、道德委员会和技术转让办公室)之间需要协作。图书馆的一个重要作用是连接和协调这些利益相关者的活动,并为研究人员提供RDM支持服务。 具体来说可分为四个发展阶段: ?初始阶段:研究资助组织越来越多地要求为其资助的研究项目制定数据管理计划(DMP)。这促使许多研究图书馆开始开发DMP支持服务。该服务通常与现有数据存储库和数据档案的转介服务相辅相成——与其他传统转介服务一致。因此,大多数图书馆RDM服务的起止时间与数据生命周期一致。 ?发展阶段:该阶段服务覆盖数据全生命周期。用于存储和共享活动数据的基础设施、培训和咨询服务通常由IT部门与图书馆合作提供。归档和发布支持服务主要包含用于发布和归档数据集的机构数据存储库(或国家存储库中的机构空间)。这一阶段的图书馆服务是普适性的,并不区分学科。 ?成熟阶段:在此阶段,咨询服务更加专业化。这需要在院系/研究部门中配备数据管理员。规模较大的研究机构促使RDM服务发展出多级组织服务结构。与此同时,图书馆也经常聘请“社区经理”来促进协作和知识交流。 ?高级阶段:此高级阶段的服务可以包括:(1)为执行操作任务的研究项目团队提供“借用”数据管理器;(2)机构研究人员对存档/发布的数据集进行监控;(3)开发围绕研究软件服务。 其中涵盖了六种工作类别:通用数据管理员或数据图书馆员、嵌入式数据管理员、数据经理、教育者/培训师(主要是数据图书馆员/数据管理员的任务的一部分,有时是一个单独的职位)、数据管理员(用于管理数据集) 存放在数据存储库中)和社区经理。 在 “RDM 支持服务“的开发过程中,可以观察到两条断层线(fault lines): ?组织结构:“RDM支持服务”从发展阶段向成熟阶段的转变,一般表现为以图书馆为中心的服务组织向一线/二线组织结构的分布式模式转变。第一线服务的数据管理员(嵌入研究部门或院系)有时由图书馆雇用,有时由院系雇用。 ?能力:“RDM支持服务”在初始和发展阶段所需的能力通常可以由传统图书馆员来满足,他们可以在工作中学习额外的、与学科无关的能力;对于处于成熟阶段的面向学科的“RDM支持服务”则通常需要不同的能力。因此,嵌入式数据管理员、高级阶段的数据管理员这两个职位往往会聘请具有特定学科研究背景的人员,原因在于他们需要具备研究数据管理的操作能力。OA服务OA服务总体目的是提供一条通往开放获取的多路,以避免单一开放获取路线的主导地位:目前,开放获取的主要驱动力是资源库中作者被接受稿件的绿色OA,黄金OA期刊中的APC付费文章,以及图书馆和出版商之间的阅读与出版协议所产生的混合期刊中的开放获取文章。人们普遍担心黄金和混合OA成本的增加,导致最近钻石级开放获取期刊的发展。在所有途径中,图书馆都发挥着至关重要的作用。 可以观察到三个发展阶段: ?初始阶段:OA服务的初始阶段包括与存储库相关的服务以及有关OA的一般教育和培训。大多数欧洲研究图书馆都运营一个存储库,并设有适当的工作流程来支持和刺激研究成果的存放,例如存储库中的绿色OA文章。该存储库可以是机构存储库,也可以是国家存储库,例如法国的HAL。 ?发展阶段:在此阶段,主要的附加服务是支持研究人员选择 OA 期刊,并在黄金期刊(通过用 OA 基金补偿 APC)或混合期刊(通过阅读和发布合同)中发表开放获取文章。 ?高级阶段:在此阶段,图书馆通过提供具有技术支持的OA期刊平台或为期刊和/或专着开发全方位服务的大学出版社来提供机构Diamond OA出版服务。作为开放教育资源的一部分,其中一些Diamond OA出版社也开始出版开放教科书。 可以区分五种工作类别:数字奖学金图书馆员/前台职能的其他图书馆员、CRIS 和/或存储库经理、开放获取基金经理、阅读和出版许可证经理、Diamond OA 出版商。 关于服务所需的组织结构和能力,有两点很重要: (1)组织结构:与已开发的RDM支持服务相比,中央组织模型似乎最适合大多数OA服务,即使处于高级阶段。 (2)能力:Diamond OA出版商的能力似乎存在断层。虽然其他工作类别由图书馆员完成,但对于Diamond OA出版服务,许多图书馆雇用具有出版背景的人员。其他利益相关者眼中图书馆的附加值来自机构内利益相关者以及(国际)国家利益相关者的受访者认为研究图书馆在OA和RDM支持服务方面的附加值有两个方面: (1)中介功能:图书馆基于对研究背景和研究人员工作环境的理解,一方面协调和连接研究人员与其他内部利益相关者之间的中介 (2)与开放科学服务相关的具体能力,例如:全面了解机构和研究资助者在开放科学、开放获取、公平研究数据、研究诚信、道德等方面的监管和政策环境等等;数字出版方面的元数据标准、本体、许可证、版权、标识符和长期保存方面的技术专长;图书馆确实已经支持出版物形式的研究成果,这使它们成为支持研究数据集形式的研究成果的合适方。开放科学的其他方面本研究重点关注OA和RDM支持服务。然而,开放科学的其他方面与研究诚信、研究评估和参与性研究(公民科学)有关。一些拥有先进OA和RDM服务的图书馆已经建立了组织结构来发挥协调和连接作用,旨在在整个机构内促进最广泛意义上的开放科学。 内容编译来自GoOA头条 原文来自:https://libereurope.eu/wp-content/uploads/Open-Science-services-by-Research-Libraries-organisational-perspectives.pdf

    发布时间: 2023-07-11

  • 7. 数字学术服务的内容与形式:一项系统综述和比较研究
    闫亚飞
    1.从数字学术定义数字学术服务 顾名思义,“数字学术服务”是为“数字学术”提供服务,即面向科研人员的数字学术行为和需求,图书馆与出版商等服务主体相应地利用多种数字技术与方法嵌入数字学术全过程或具体场景提供服务。不同图书馆对此也有不同的理解和业务范畴,例如:美国匹兹堡大学图书馆认为数字学术服务是图书馆资源、专业能力和服务的前端,支持一系列数字化和数据密集型学术活动,该图书馆数字学术服务的主要领域包括编程和计算支持、研究数据服务、数字创作和管理、地理空间数据与分析、文本挖掘与分析等。香港中文大学图书馆表明会利用数字证据、工具、方法及程序去协助教研人员和研究生进行学术研究,并通过提供空间、工具、平台、培训及咨询等服务嵌入学术研究周期支持和推广数字学术。美国莱斯大学图书馆的数字学术服务主要是通过提供基础设施、咨询和培训,促进在研究、学习和学术交流中有效地、创造性地使用数字技术。基于学术交流、教学研究、数字技术和数字产品等数字学术的内涵,图书馆通常通过列举主要服务手段和内容、列举主要服务场景和目标等方式定义各自的数字学术服务。 2.图书馆“数字学术服务”的名称与形式 2017年,笔者对若干研究型图书馆的数字学术服务进行了广泛的探索性预调研,在此基础上考虑图书馆网站是否有实质性的“数字学术服务”内容,最终选择15所图书馆为调研对象,调查分析并总结归纳了图书馆数字学术服务的内容和特点;2022年,为了进行准确的对比分析,本文再次选择同样的15所图书馆为调研对象,以期更好地呈现数字学术服务的动态发展过程、为图书馆持续深入探索数字学术服务提供有益参考。图书馆“数字学术服务”有“数字学术研究服务”(DigitalScholarshipResearchservices)、“数字学术空间”(DigitalScholarshipCommons)、“数字学术实验室”(DigitalScholarshipLAB)、“数字学术中心”(CenterforDigitalScholarship)等名称和形式,且处于动态发展变化之中。根据调研可知:①部分图书馆(如北卡罗来纳大学夏洛特分校图书馆)取消了专门的“数字学术服务”栏目但并没有取消相应的服务,而是将相应服务并分散在不同的服务栏目之中,如研究数据服务、数字出版服务等;②部分图书馆(香港中文大学图书馆、哥伦比亚大学图书馆)的“数字学术服务”名称略有调整;③部分图书馆(如埃默里大学图书馆)将合作的“数字学术中心”转移给校内IT部门;④部分图书馆(如圣母大学图书馆、香港中文大学图书馆、哥伦比亚大学图书馆)既设置“数字学术服务”栏目,同时又在其他栏目提供更多属于“数字学术服务”的相关服务。 3.图书馆“数字学术服务”的内容及分类 根据前文从学术交流、教学研究、数字技术、数字产品等角度对“数字学术”内涵的阐述,除“数字学术服务”栏目所包括的服务内容之外,本文也调研分析了其他栏目的数字学术服务相关内容,据此总结数字学术服务的内容及分类。根据2017年8月的调查,数字学术服务内容包括物理空间、数字科研工具、研究数据服务、学术交流与数字出版服务、数字人文服务、数字学术研讨与培训服务、数字技术支持服务等7类;根据2022年8月的最新调查,数字学术服务服务内容可归纳为物理空间及设施设备服务、学术交流与数字出版服务、数字教学与研究服务、数字产品制作服务、数字技术支持服务、数字人文服务等6类。需要说明的是,数字学术服务包括多种多样的具体服务内容,同一服务内容也可纳入不同的类别。对比发现,这15所图书馆2017年和2022年数字学术服务的动态变化在于:①整体图书馆的数字学术服务内容变化不大;②个体图书馆的服务内容呈现适度减少和聚焦趋势,其中适度减少的服务包括基础性培训与咨询服务,同时特殊数字化设备及其服务采取先申请再服务(按需按序服务)的方式加以适当限制;适度聚焦于文本挖掘与分析、研究数据管理、数据可视化设备及服务、数字出版和数字展览、数字化设备与制作服务、数字学术项目合作与服务等。 3.1物理空间及设施设备服务一方面,图书馆“数字学术服务”名称本身包含物理空间成分,如“数字学术空间”“数字学术实验室”“数字学术中心”等称谓本身便表征了数字学术的一种空间存在;另一方面,“数字学术服务”大多设有专门功能的空间服务,尤其是研讨、协作和可视化空间。根据调研,图书馆用于数字学术服务的空间主要可分为两类,一是技术性空间,配备了相应的数字硬件和软件设备,如3D打印机、VR设备、高分辨率可视化墙、高分辨率扫描设备等;二是协作性空间,为教职人员和学生提供研讨、协作、共享服务。 3.2学术交流与数字出版服务图书馆是学术交流生态系统中不可或缺的一环,数字学术环境下学术交流包含讨论、发表、展览、传播等活动形式,图书馆相应提供开放获取、数字出版、版权咨询、数字展览与传播等方面的服务:开放获取服务:包括开放获取政策、开放获取咨询、开放获取基础设施支持等;版权与合理使用咨询服务:包括版权与合理使用咨询、相关辅助性资源等;数字出版及存储平台服务:包括开源数字出版平台推荐及服务(如OmekaS、OpenJournalSystems)、机构数字知识库/存储库平台服务等;数字展览服务:数字展览平台及展览展陈服务、宣传推广服务等。 3.3数字教学与研究服务大学与研究图书馆的基本使命之一便是为教学与研究提供服务,数字教学与研究服务是数字学术服务的重要内容,主要表现为:数字教学支持服务:包括开放教育资源推荐与集成、开放教学支持(一手资料的管理与数字化、从已有数字馆藏中获取高分辨率图像复制品)、数字课堂支持与服务;数字研究支持服务:包括文本挖掘与分析、元数据、数据可视化、研究数据管理、地理信息系统(GIS)服务、研究影响力评价等;数字研究项目合作及服务:图书馆以合作伙伴或服务者等角色主导或参与校内外数字研究项目的规划、实施、管理及技术支持;数字技能培训:数字化教学与研究技能的培训,包括各种形式的工作坊、研讨会等。 3.4数字产品制作服务数字产品制作服务通常与物理空间及设施设备服务、数字出版服务等密切相关。除数字出版物之外,数字产品制作服务还包括相关工具、场所及服务:多媒体产品设计与制作,如视频、音频等多媒体产品;高分辨率数字产品制作,如使用Adobe系列软件制作图像;大幅面资料扫描与数字化制作,如地图等。 3.5数字技术支持服务图书馆通常在数字学术项目和数字学术活动的任何场景提供用户所需要的技术、软件工具、平台及基础设施支持,包括但不限于数字馆藏平台、开源网络出版平台、数字展览平台、数字存储平台、数字软件及技能支持(如文本挖掘、网络爬虫、机器学习、自然语言处理及Python、R等编程软件)等。 3.6数字人文服务如前所述,“数字人文”被认为是人文社会科学领域的数字学术,因此数字人文服务也是一种特殊的数字学术服务。部分图书馆在“数字学术服务”栏目内设置“数字人文”服务(如香港中文大学图书馆);部分图书馆在“数字学术服务”栏目之外设置“数字人文”服务(如圣母大学图书馆);部分图书馆的数字学术服务即数字人文服务(如里士满大学图书馆)。根据调研,研究型图书馆所提供的数字人文服务主要包括数字人文概念推广及软件工具支持、数字人文实践社区服务、数字人文项目合作与服务等。 4.图书馆数字学术服务的框架要素数字学术服务内容丰富、形式多样,为了从抽象层面更好地加以概括,笔者参考常见的图书馆服务框架模型并将数字学术服务的框架要素归为服务对象、服务手段、服务场景和服务内容4个方面,首先,图书馆数字学术服务的服务对象主要为图书馆所在母体机构的学生、教师和职员等学术用户,与传统学术服务的对象并无明显差别。其次,服务手段主要包括空间、技术(软件、平台)、资源(馆藏资源、开放资源)、设备和人员,图书馆员借助空间、技术、资源和设备等条件并结合自身的经验和智慧为用户提供各类服务。再者,图书馆数字学术服务的服务场景可分为两类:在数字学术项目过程中提供服务,即服务于项目(project)形式的数字学术活动;在具体而分散的多种数字学术活动中提供服务,即服务于具体的数字化创造、出版、管理、保存、传播、评价等一种或多种活动。在此基础上,图书馆提供物理空间及设施设备服务、学术交流与数字出版服务、数字教学与研究服务、数字产品制作服务、数字技术支持服务、数字人文服务等多种服务内容。 5.图书馆数字学术服务的组织形式 5.1机构设置方面在校内二级机构归属层面,图书馆数字学术服务的设置包括以下3种情况:由图书馆和校内其他部门合作并共同建设和运营,如华盛顿大学图书馆的开放学术空间与EScience部门、人文中心、学习技术中心等多个校内部门联合运营;原本由图书馆和校内其他部门合作但后来被图书馆移交出去,如埃默里大学图书馆将数字学术中心移交给校内IT部门;由图书馆独立或主要承担各项运营和服务工作,被调研的大部分图书馆都属于这种情况。因此,整体来看图书馆负责数字学术服务是主流情况,图书馆与校内机构合作负责数字学术服务也是一种可供借鉴的模式。在图书馆内部部门设置层面,图书馆数字学术服务的设置包括以下几种情况:图书馆专门设有数字学术服务相关部门;将数字学术服务设在其他上位服务部门;图书馆不设数字学术相关部门或未展示是否有相关部门。可以认为,提供数字学术服务与是否专门设置数字学术服务相关部门无必然关系,主要取决于图书馆的实际情况。在图书馆部门的团队配备和人员设置层面,所有被调研的图书馆数都以相关名称展示了数字学术服务团队及人员情况。 5.2人员设置方面在人员组成方面,图书馆数字学术服务人员主要由图书馆职工组成,部分图书馆设有学生助理、博士后研究人员等。在人员角色方面,相关人员围绕数字学术服务的“主责主业”承担着多样化、跨学科的角色,其岗位名称主要依据具体负责的业务范畴或工作内容而确定的,如数字学术馆员、学术交流馆员、版权馆员、研究数据服务馆员、学术出版外展(outreach)馆员、在线出版设计师、数字技术馆员等。在人员规模方面,整体而言数字学术服务人员规模不大,以4—6人、8—10人最为常见。 5.3岗位要求方面从图书馆员岗位名称、工作内容及成员介绍等可以看出,数字学术服务不仅要求图书馆员具有基本的图书馆业务知识和技能,还倾向于馆员拥有多学科背景或掌握多种数字技能,并且馆员的兴趣爱好也非常多元化并具有学科跨度。总之,数字学术服务馆员需要不断学习新知识、新技能以更好地适应岗位要求并满足用户需求。

    发布时间: 2023-07-11

  • 8. 所有Nature的研究论文采用透明同行评审
    程冰
    自2025年6月16日起,所有在Nature期刊新提交并最终发表的研究论文,将自动附带审稿报告和作者回复链接,这项出版政策变革揭开顶刊科学出版的神秘面纱。 透明评审是学术出版领域的新型同行评议模式。1973年Nature才开始强制要求所有发表的研究论文进行同行评审,2016年Nature Communication实行透明评审,2020年Nature提供了可选择的透明评审,今年6月16日起,所有在Nature期刊新提交并最终发表的研究论文都采用透明评审。在这一评审模式下,Nature审稿人身份默认保密,但可选择公开署名,论文将完整公开审稿专家与作者间的学术对话,包括修改建议与回复。这一举措展示了Nature论文从投稿到出版的交流过程,出版同行评审报告帮助研究人员更好了解同行评审过程,促进科学知识传播。

    发布时间: 2025-07-23

  • 9. 《ARL/CNI场景设想:人工智能影响下的未来》完整版发布
    程冰
    当地时间2024年6月27日,北美研究型图书馆协会(Association of Research Libraries,ARL)与网络信息联盟(Coalition for Networked Information,CNI)发布了完整版《ARL/CNI 场景设想:人工智能影响下的未来》(Deluxe Edition of the ARL/CNI AI Scenarios: AI-Influenced Futures)。该出版物作为研究型图书馆和相关组织的重要资源,旨在对人工智能带来的变革性影响力进行战略规划。 文件内容主要包括: ·设想场景集合:该场景集探讨了人工智能发挥关键作用的未来情况,为研究环境不断变化的挑战和机遇提供了关键性见解。 文件内容,见 http://www.chinalibs.net/ArticleInfo.aspx?id=570674&cb=qinyue。 ·战略背景报告:ARL和CNI在2023-24年冬季和2024年春季举行了关于“人工智能对未来研究环境的影响”的焦点小组会议和访谈,该报告收集了通过以上活动获得的社区反馈信息。 文件内容,见 http://www.chinalibs.net/ArticleInfo.aspx?id=570677&cb=qinyue。 ·人工智能领域行业领袖访谈报告:这些访谈以与行业领袖的前瞻性对话为特色,挑战传统智慧,激发了人们对人工智能影响下的未来的延伸思维。 文件内容,见 http://www.chinalibs.net/ArticleInfo.aspx?id=570679&cb=qinyue。 该版本旨在通过为研究型机构的利益相关者提供必要的工具和知识,来预测和塑造人工智能时代研究环境的未来方向,从而为其赋权。 ARL曾在2024年5月发布过该文件的初始版本,随同发布的文章大致罗列并解释了ARL和CNI对人工智能影响下的未来设想场景,欲了解相关信息,参见往期文章: http://www.chinalibs.net/ArticleInfo.aspx?id=565723&cb=qinyue。

    发布时间: 2024-07-26

  • 10. IFLA出版《图书馆推动可持续发展教育》
    程冰
    2025年6月,IFLA出版《图书馆推动可持续发展教育》一书,对图书馆开展用户教育和服务具有重要参考价值。 世界正面临着紧迫而严峻的环境、社会和经济挑战。变革的重点是通过联合国17个可持续发展目标(SDG)和2030年议程。可持续发展教育(ESD)是教科文组织为促进成功未来所需的个人和社会转型而做出的回应。图书馆和图书馆员可以很好地推动所需的教育流程。这本书汇集了世界各地图书馆在可持续发展教育可持续发展方面的成功倡议,为其他人提供榜样和启发。 这本书提到了联合国教科文组织的2030年可持续发展教育计划。图书馆,尤其是绿色和可持续图书馆,作为学习机构和可持续发展教育的积极推动合作伙伴,并支持政府的可持续发展工作,它们应该得到突出的认可。根据《可持续发展教育柏林宣言》和联合国教科文组织计划,本书重点介绍由绿色和可持续图书馆创建和提供的创新方法和非正式教育项目。       编辑:Petra Hauke、Antonia Mocatta 和 Priscilla Nga Ian Pun       柏林/波士顿:de Gruyter,2025年。452页,插图(IFLA 出版物;186)。       电子版ISBN:978-3-11-133646-6       精装ISBN:978-3-11-133570-4    

    发布时间: 2025-07-23

  • 11. 结构要素语义关系视角下学术论文间逻辑关联挖掘研究
    程冰
    [目的/意义] 旨在通过学术全文本结构要素的语义关联分析,深度分析并挖掘论文间逻辑关联,多方位梳理研究发展趋势,促进学术创新,为知识管理和学术评价提供新视角。[方法/过程] 首先基于论文题录和篇章结构进行学术论文结构化建模,结合深度学习与规则匹配方法开展向量表征和内容抽取;其次采用语义相似度、词共现等方法开展不同论文结构要素间的组合、对比、关联分析,归纳学术论文间存在的递进和补充逻辑关系;最后基于上述关系构建双层结构事理图谱,析取学术论文逻辑关系网络,并从不同结构要素主导的多维视角深入剖析两类逻辑关系,从而厘清知识演化路径,加速知识创新过程。[结果/结论] 实证结果表明,研究提出的方法能够准确识别论文间存在的逻辑关联,弥补引文分析法在关系维度和关系精度上的不足,为学术论文间关系判断提供新途径。

    发布时间: 2025-07-22

  • 12. 人工智能时代的算法素养——内涵剖析与能力
    杨小芳
    人工智能时代的到来强化了技术环境对社会发展的影响,算法的广泛应用塑造着新的社会结构与规则,也对人们的信息处理能力提出了更高的要求。算法素养作为人工智能时代重要的素质能力集合被提出。       在信息时代,信息成为世界运行所仰赖的血液、食物,信息素养则成为人类参与工作和日常生活的基本能力,也成为图书情报学科的重要研究话题。随着信息技术的不断发展,人类社会先后经历了信息时代、数字时代、大数据时代、人工智能时代。为应对技术环境变化,以信息及其载体、表现形式、服务形式为核心,出现了诸如“计算机素养”“数字素养”“数据素养”“AI素养”等概念。       综合已有文献对算法素养的定义,融合功能型定义与解释型定义两大方向,将算法素养定义为:“具备感知、理解和使用算法的能力,能够正确使用以算法为驱动力的产品并具备对算法社会的适应能力。”以此为基础,对算法素养的功能进行更详细的解释,即具备算法素养的人能够:①拥有使用算法及相关技术工具解决所遇问题的能力;②意识到并理解以算法为驱动力的社会及其运行规则;③能够对算法及其产生的正面、负面效应进行客观评价,具备算法风险意识。       算法素养是人工智能时代人类适应社会技术变化的体现。基于对相关概念溯源与算法素养定义的梳理,结合算法素养界定的核心思想,从个体与社会两个角度对算法素养内涵特点进行解读。       首先,算法素养反映的是社会技术环境对个体的能力素质要求,理解其内涵有两个关键点。①时代背景。算法素养的产生以人工智能技术发展为时代标志,是算法普遍应用与算法负面效应暴露等内外动因推动的结果。算法素养与计算机素养、数据素养等概念的核心区别在于时代的独特性。②素养本质。尽管算法素养是素养在人工智能时代的革新,但它与信息素养、数据素养等概念一脉相承,从本质上看仍属于人类素质能力范畴,对算法素养的研究也应以人为核心展开。       其次,算法素养是内化于个体的能力集合,涵盖意识、技能、知识等多个方面。从个体的角度理解算法素养有三个关键点。①面向问题解决。算法素养的核心价值是增强个体对技术环境的适应能力,适应技术环境则要求个体能够使用算法及关联技术工具解决具体问题。②感知并理解以算法为核心驱动力的社会。算法素养要求个体能够感知社会发展中的驱动力变更,并将个人作为这一变更的参与者,共同参与到算法决策和管理中。③辩证理解算法价值。算法素养需要个体全面理解算法应用的价值及其对社会经济、政治、文化的影响,包括积极影响和消极影响。      人工智能技术改变了社会驱动结构,也在一定程度上推动着社会价值和文化观念的转变,对身处社会环境中的“人”也提出了新的能力素质要求。20世纪70年代为应对计算机技术发展,学者们将目光聚焦于信息素养,围绕个人信息处理的意识、能力开展研究。而今以算法为支撑的人工智能时代也为素养研究带来了机遇与挑战。尽管算法素养仍是一个探索中的概念,但随着算法对社会发展的作用日益凸显,应当尽早关注其带来的技术鸿沟与社会风险,算法素养极有可能成为新的突破口。

    发布时间: 2024-10-31

  • 13. 人才外流将使美国受损并削弱全球科学
    程冰
    过去一个世纪,美国凭借优越的科研环境和资金支持,始终是全球科学家的首选地。然而,随着科研政策动荡和学术生态改变,这一格局正在变化。Nature最新调查显示,在1600多名受访的美国读者中,约75%正考虑离开美国,其中,多数人将欧洲和加拿大列为首选地。 来自法国、德国等13个国家的研究部部长联名建议欧盟“接纳因科研干预和资金削减而受困的国外杰出人才”。欧洲研究委员会计划将人才引进资助上限翻倍至200万欧元;荷兰设立专项基金吸引因地缘政治迁徙的顶尖学者;比利时和法国高校则直接向美国研究者提供特定机会。文章中还提到,二战以来美国始终是这场人才流动的终点站,若趋势逆转,将是美国的损失和全球科学的倒退。

    发布时间: 2025-07-23

  • 14. 英国研究与创新署更新其对图书开放出版的资助政策
    于彰淇
    11月15日,英国研究与创新署(UK Research and Innovation,UKRI)发布了更新的关于专著、书籍章节和编辑集的开放获取政策。自2024年1月1日起,受其资助的专著、书籍章节和编辑集需要在出版后12月内对公众开放获取。为此UKRI提供了350万英镑的专项资金,用于支持该政策范围内长篇出版物的开放获取成本。这是继2021年UKRI更新政策,要求自2022年4月起受其资助的研究论文需要在出版后立即对公众开放获取后的又一重大更新。该政策旨在确保英国研究与创新 (UKRI) 公共资金资助的广泛研究成果可以自由获取。这将使研究和创新界以及更广泛的社会更容易地利用研究结果。该政策还寻求支持更广泛的社区发展长篇研究出版物的开放获取。申请将于2023年11月开放新基金将于2023年11月28日开始接受第一阶段申请。研究机构将能够为资金注册出版物,并从英国研究与创新署获得确认,确认出版物在基金范围内。第二阶段申请,即研究机构确认出版并由英国研究与创新署按公布的最高水平报销费用,将于2024年1月开放。资助额度可申请的资助额度为:单部专著或编辑集的开放获取,若支持书籍处理费(BPC),可获得最高10,000英镑的资助。钻石或非BPC开放获取方案,若有一个符合英国研究与创新署(UKRI)资格的专著或编辑集在该方案下出版,可获得最高6,000英镑的资助;若有两个或更多符合条件的出版物,则最高可获得9,000英镑的资助。书籍章节处理费可获得最高1,000英镑的资助确定以上资助额度,英国研究与创新署(UKRI)的目标是:支持研究人员和机构发表开放获取作品。支持多样化的资金模型。确保资金的可持续性。确保资金使用的性价比。资金可用于支持立即发表的具有知识共享许可的记录版本。作者和研究组织可以在出版后 12 个月内将记录版本或作者接受的手稿开放获取,以遵守该政策。有关新开放获取基金的所有指南均可在??开放获取资助和报告中找到。https://www.ukri.org/manage-your-award/publishing-your-research-findings/open-access-funding-and-reporting/

    发布时间: 2023-12-01

  • 15. 整合CAVAL能力框架与五因素模型以提升高等教育图书馆与信息科学专业人员的能力
    程冰
    2025年3月30日,印度学者在New Review of Academic Librarianship期刊上发表了一篇关于评估信息管理专业人员能力的文章。在当今以技术为中心的高等学术和研究机构图书馆环境中,大多数图书馆服务高度依赖技术。这就要求图书情报学(LIS)专业人员具备特定的能力,以适应快速变化的工作环境。为了评估 LIS 专业人员的多样化专业技能,本文采用了CAVAL能力技能,还结合了公认的五大人格特质模型,以描绘 LIS 专业人员的不同人格维度。通过两套在线问卷收集数据,基于这些数据生成了能力技能和人格特质的评分。随后,这些评分被用于研究能力技能与人格特质之间的关系,力图构建一个人格相关选择模型(PRSM),以探讨能力技能与人格特质之间的相关性。 模型表明,图书馆与信息科学(LIS)专业人员的能力技能受到其独特人格维度的影响,表明人格评估可以预测这些专业人员的能力技能。本模型有望为高等学术和研究机构中 LIS 专业人员的招聘政策制定提供参考。

    发布时间: 2025-07-23

  • 16. 数据与知识双驱动的知识组织系统构建框架研究
    闫亚飞
           知识组织系统(KOS)反映领域知识的概念及概念关系,是描述、表示特定领域的知识而生成的语义工具,涵盖了从简单的术语表到包含语义关系的规范档、受控词表、本体等。 知识组织系统的构建方式与计算机技术的发展相呼应。早期知识组织系统的构建主要依赖于专家先验知识,具有严格受控、权威性、全局性等优势。但纯粹依赖专家构建的知识组织系 统具有不可忽视的缺陷:一是主观性强,多依赖于专家先验知识,缺乏对终端用户需求的客观反映;二是实时性不强,知识组织系统构建后处于封闭静止状态,其无法通过自主学习进 行知识动态更新,术语经过长期实践积累达到一定规模后,才会由专家进一步更新,因此知识组织系统的概念更新缓慢,具有滞后性;三是成本较高,严格受控的概念选取及层次结构 建设使手工构建知识组织系统耗时耗力。大数据环境下实时更新的数据资源有待挖掘以提供各种智能化决策,其为知识组织系统提供了丰富的语料,自动构建知识组织系统成为可能, 通过对多源海量数据的自动采集、加工、处理、分析、整合和提炼,抽象形成具有一定结构的概念知识体系,但自动构建的方式依然有一定的局限性:一是机器语义理解差,从海量数 据中挖掘其结构,生成达到一定语义规范的概念存在困难;二是知识组织系统具有严格受控的多层次结构,机器学习技术仍难以自动化识别概念之间的丰富语义关系,建立语义关联且 形成符合用户需求的概念层级结构仍需人工干预;三是对数据质量要求高,自动化构建的知识组织系统高度依赖于所采集的涵盖主题领域的数据样本,数据的质量决定了最终形成概念 体系的质量。当前数据与知识相结合的第三代人工智能的出现,旨在将专家知识与海量数据有机结合,提升数据处理效率和质量。 如何借此契机,探索知识组织系统新的构建方式将成为当前知识组织领域的重要问题。         文章在分析国内外研究现状的基础上,从理论层面深度剖析数据和知识的协同机制,应用符 号学理论分析“数据”与“知识”之间的双向转换关系,并从知识组织系统的语法、语义、 语用角度,提出数据与知识双驱动的知识组织系统构建框架,有助于厘清数据与知识的双向转化,突破现有知识组织系统构建方法存在的局限,实现两种构建方法的深度融合及优势互 补,为数智时代自动构建高质量、高效率的知识组织系统提供新的路径。       知识分为隐性和显性两种类型。隐性知识是通过经验、行动、主观的洞察力等嵌入人类头脑中,难以正式表达、沟通或分享的知识;显式知识是可以正式表达、共享、复制、存储 的知识,更具有实用价值。知识管理中这两类知识通过相互转换而实现价值,但转换过程离不开数据支持。海量数据中蕴含着有待被挖掘的一定量的显隐性知识,经过分析、加工、 提炼等形成可表达的显性知识,服务于具体应用场景,进而产生新的数据,如此不断反复。如何从海量“数据”中获取、提炼、转换为有用的“知识”,“知识”又如何物化成可计算 的“数据”是实现数据与知识两者有效转换的关键。数据到知识的转化过程一直都是信息管理、信息系统、计算机领域等多个学科或领域关 注的热点话题。数据本身是观察的产物,存在于人类的思维之外,没有任何意义,定义为 表示对象、事件及环境的属性的符号。美国哲学家皮尔斯(Pierce)的符号学理论指出符 号由三个相互关联的基本要素组成:符号形体(Representamen)、对象(Object)和解释 项(Interpretant),其中符号形体可视为一种指代,对象是由符号所指的客观存在,解释项是人对符号与物体之间联系的理解和反应。由此看出,当认知主体对客观物理世界 进行感知时,从而为客观对象赋予了能够表征它的符号,即形成了多样化数据。而符号的含 义则是由主体所认知的知识来反映,此时知识成为提供符号意义的解释项,体现了对客观世界的理解和反映,使人们能够共享符号及符号语义以实现无障碍交流。知识由认知主体对客 观世界中数据(符号)的理解和反映而形成,通过对数据一系列组织和处理分析,形成对当前问题或活动的解释、理解及经验。数据密集型社会带来了数据量的激增,借助于统计学、 机器学习等技术,对海量数据进行提炼总结形成知识,数据到知识的转换效率提升。 知识向数据的转化是一个反向过程,当知识被语法、语义等结构描述后成为信息,信息被详细定义的数据结构规范后成为数据。数据是可被计算的符号,知识为数据符号提供 了语义解释。知识转化为数据就是将知识描述为可被计算的形式化结构,应用到数据处理环节中,以提升数据处理的效率。不断增加的知识同样面临序化表示的问题,知识组织系统作 为重要的工具,以知识为主要描述对象,对知识进行表示、描述、共享和使用,从而为符号所表达的语义意义提供明确的概念共识。正如 Qin Jian指出,知识组织系统实际上是将 人类对世界理解所形成的知识组织成各种系统或工具,以推动知识的再利用与创造。知识向数据转化过程需要各种知识组织系统的参与,通过对知识进行显性化、表示和存储,以更好 用以解释数据含义。 数据与知识的双向转化形成了一个联动的持续循环过程。依据波普尔“三 个世界”理论,上层表示物理世界,指代一切物质客体;中层表示精神世界;下层表示客观知识世界,凸显认知主体对客观世界中实体对象的感知和反映。物理世界产生了大规模的 实体对象,催生了用于指代实体对象的海量数据。数据作为认知主体给予对象的识别符号,数据的激增促进了认知主体对新的解释项的产生和扩充,进一步提升了对知识本身处理的需 求,推动知识组织系统的不断发展及应用。从海量数据中获取知识,以知识组织系统方式表示,并将知识组织系统应用到数据处理中,这样不仅推动数据与知识转换及增值,而且能够 动态反映外部客观世界变化,实现数据与知识从静态化向动态化管理。

    发布时间: 2023-07-11

  • 17. Nature重磅:Google DeepMind推出AlphaDev,可自主构建C++排序算法,或将加速全球计算
    黄雨馨
    数字社会对计算和能源的需求正在不断增加。在过去的五十年中,人类主要依靠硬件层面的改进来满足这一点。然而,随着微芯片接近其物理极限,改进运行在其上的代码以使计算更强大和可持续也变得至关重要。 对于每天运行数万亿次的算法而言,这一点尤为重要。因为它们支撑着从在线搜索结果和社交帖子的排名到计算机和手机上数据处理的一切。 如今,Google DeepMind 推出了 AlphaDev,一种利用强化学习来发现改进的计算机科学算法的人工智能系统,其自主构建的算法,超越了科学家和工程师几十年来打磨出来的算法,将一种每天在世界各地使用数万亿次的 C++ 算法的运行速度提高了 70%。 相关研究论文以“Faster sorting algorithms discovered using deep reinforcement learning”为题,已发表在权威科学期刊 Nature 上。 “说实话,我们没有想到会取得更好的成绩:这是一个非常短的程序,这些类型的程序已经被研究了几十年,” 论文的第一作者、Google DeepMind 的研究科学家 Daniel Mankowitz 说道。 Google DeepMind 表示,他们已经将该算法纳入常用的 Libc++ 库,这是十多年来对这部分排序算法库的首次修改。这意味着,全球数百万开发人员和公司现在可以将其用于从云计算和在线购物到供应链管理的人工智能应用中。 MIT 教授、CSAIL 首席运营官 Armando Solar-Lezama 在评论文章中写道,“也许更值得注意的是,人工智能系统可以在不了解问题本身的情况下改进代码。” 通过游戏找到最佳算法 利用人工智能生成更好的算法,将改变我们编程的方式,影响我们日益数字化的社会的各个方面。 排序算法是世界各地的计算机不断使用的基本功能,因此,由人工智能创造的改进算法可以使数百万程序运行得更快。 据介绍,AlphaDev 基于 AlphaZero(一种强化学习模型,在围棋、国际象棋等游戏中击败了世界冠军),通过 AlphaDev,Google DeepMind 展示了这个模型如何从游戏转移到科学挑战,并从模拟转向现实世界的应用。 为了训练 AlphaDev 来发现新算法,DeepMind 将排序转化为一个单人“汇编游戏”。在每个回合,AlphaDev 都会观察它生成的算法和 CPU 中包含的信息。然后,它通过选择一条指令来为算法添加一步行动。 这个汇编游戏非常困难,因为 AlphaDev 必须有效地搜索大量可能的指令组合,以找到一种比当前最佳算法更快的排序算法。可能的指令组合的数量与宇宙中的粒子数量或国际象棋和围棋中可能的行动组合数量相似,一次错误的行动就可能会导致整个算法无效。 在构建算法时,AlphaDev 逐步添加一条指令,并通过将算法的输出与期望结果进行比较来验证其正确性。对于排序算法来说,这意味着无序的数字输入,正确排序的数字输出。Google DeepMind 根据 AlphaDev 正确排序数字的能力以及完成排序的速度和效率来奖励它。AlphaDev 通过发现一个正确且更快的程序来赢得游戏。 最终,AlphaDev 构建了一个新算法,对于 5 个数据的列表,它比最好的算法快 70%,对于超过 25 万个项目的列表,它比最好的算法快 1.7%。 “我们最初以为它犯了一个错误,或者有一个 bug 或其他东西,但是,当我们分析这个程序时,我们意识到 AlphaDev 实际上已经发现了更快的东西,”Mankowitz 说。 Mankowitz 表示,“优化每天被调用数万亿次的基本函数的代码,有望带来足够大的好处,鼓励人们尝试执行更多这些函数,并将其作为解决摩尔定律放缓瓶颈的途径之一。” 对此,英国伯明翰大学教授 Mark Lee 认为,AlphaDev 很有意思,即使是 1.7% 的速度提升也很有用。但他也认为,即使在其他普通算法中发现类似的效率,也不能确定这种方法真的可以弥补摩尔定律的瓶颈,因为它不能在更复杂的软件中取得同样的收益。 构建通用人工智能工具的重要一步 目前,Google DeepMind 正在探索 AlphaDev 在 C++ 等高级语言中直接优化算法的能力,这对于开发人员来说将更加有用。 Google DeepMind 在官方博客中写道,“通过优化和推出全球开发人员使用的改进排序和哈希算法,AlphaDev 展示了其具有真实世界影响的泛化和发现新算法的能力。我们将 AlphaDev 视为发展通用人工智能工具的一步,这些工具可以帮助优化整个计算生态系统,并解决其他有益于社会的问题。”

    发布时间: 2023-07-11

  • 18. Springer Nature 2024年度利润增长7%
    程冰
    3月18日,Springer Nature 今天公布了其 2024 财年的业绩,全年收入 18.47 亿欧元,比 2023 年同期增长 5%。调整后营业利润增至 5.12 亿欧元,同期增长 7%。预计2025 年收入在 18.85 ~19.35 亿欧元,利润率至少保持2024年水平。 研究部门是 Springer Nature 主要增长驱动力。基础收入增长了 6%,达到 14.14 亿欧元,这主要是由于 OA 期刊产品组合的出色表现。2024 年以 OA 形式发表的研究文章首次达到 50% ,这一成就凸显了公司在向 OA 过渡方面的领导地位,通过提高科学研究的可及性和影响力,为研究界提供更大的价值。

    发布时间: 2025-07-23

  • 19. 数智化图书情报监测快报
    数图
    数智”赋能正逐步成为推动图书情报领域创新发展的新动力,大数据+人工智能等新技术为图书情报领域发展带来了新机遇,数智化图书情报监测快报聚焦大数据、人工智能等技术在图书情报领域应用现状,跟踪最新研究成果,为领域研究人员提供信息支撑。

    发布时间: 2023-11-29

  • 20. ChatGPT赋能图书馆虚拟数字人:技术优势、应用场景与实践路径
    程冰
    虚拟数字人是一种利用计算机技术、人工智能技术和图像学技术的人形虚拟实体,其外部形象和外显行为是通过在虚拟现实环境中使用机器学习、语言生成、模拟对话等数字化技术来模拟真实世界人物的行为来生成的。其具有高度的可定制性、自主和自适应的学习能力、逼真的外貌形象和动作表现、自然而流畅的交互方式以及高效的算力效率等特征。为了实现虚拟数字人的“拟人化”,需要使用模型驱动技术赋予其与人相似的特征。这些驱动技术主要包括三种:第一个是图像迁移技术,也称 CG 建模技术,利用计算机技术进行视觉设计和生产,使虚拟数字人的外观更真实拟人;第二个是自然语言处理技术,训练虚拟数字人的语言对话能力,使虚拟机器人和用户的对话更加人性 化;第三个是 CV 等深度学习模型,通过大量的原始数据训练虚拟数字人,使其不断进行自我进化,完善计量框架等,进一步丰富虚拟数字人的“灵魂”。 虚拟数字人近年来备受关注,作为一种新兴的技术,其在商业活动、文化教育、智慧城市等众多领域发挥作用,图书馆也是虚拟数字人的重要应用场景。在图书馆服务中,虚拟数字人可被视作一种新的交互媒介,其能够模拟和再现真实世界中的各种人类活动和行为,并创造出一些超越现实的全新体验和知识。在元宇宙领域,虚拟数字人作为一种集数据赋权、智能化决策、实时互动、非线性组合和多源交互于一体的新型决策主体,有助于形成特定感知、响应、协调的新型敏捷治理路径。虚拟数字人也是元宇宙中的数字记忆主体,有助于图书馆等文化记忆机构参与构建、长期保存数字记忆和进行服务创新。有学者提出,图书馆有必要将普通虚拟形象升级为虚拟数字人开展服务。 ChatGPT 一经问世便引起信息资源管理领域学者的广泛关注。陆伟等提出,ChatGPT 在支撑算法与技术、信息资源建设、信息组织与信息检索、信息治理、内容安全与评价、人机智能交互与协同等方面都具有深远的影响。目前,ChatGPT 在图书馆领域的应用研究主要集中在以下三个方面:一是智能问答系统,围绕 ChatGPT 的生成能力,快速、准确地回答用户提出的问题,为用户提供更加智能化的服务;二是虚拟助手,通过 ChatGPT 提供更加贴近用户需求的服务,不断优化自身的服务质量,提高用户满意度;三是文献推荐系统,通过分析用户的阅读记录和兴趣偏好,自动生成与用户兴趣相关的文献推荐,提高用户的阅读体验和阅读效率。ChatGPT 的出现为图书馆人智交互提供了更加高效、准确、自然的解决方案,为图书馆的未来发展提供了新的思路和方向。 ChatGPT 在自然语言处理领域取得了显著成果,可实现拟人化交互和更高效地向虚拟个体提供技术基础。ChatGPT 赋能虚拟数字人的相关探索主要有以下几个方向:第一,通过对 ChatGPT 进行微调,使其能够生成更符合人类交互习惯的自然语言,从而使虚拟数字人的语言生成更加自然流畅。同时,将语义理解的知识引入,让虚拟数字人能够更加准确地理解用户的意图,提升交互质量。第二,学者们通过对 ChatGPT进行情感训练,使其能够识别和表达不同情感状态下的语言和行为,从而使虚拟数字人更真实地表现出情感,并能够进行情感识别和反馈。第三,在虚拟数字人的多模态交互方面,学者们将 ChatGPT 与图像、声音等多模态信息进行融合,例如与人脸识别技术相结合,虚拟数字人能够精准识别用户的表情,以理解用户意图并为其提供相应服务。 ChatGPT 赋能虚拟数字人在图书馆领域具有重要的价值和意义,是提升图书馆服务水平、优化服务效率以及推动服务模式创新的必要选择,也是适应信息化时代发展趋势的重要举措。本研究聚焦于 ChatGPT 在图书馆虚拟数字人领域的应用,着重探讨其技术优势、应用场景和实践路径,以更好地推动智慧图书馆的建设和发展。具体来说,ChatGPT 赋能虚拟数字人的优势包括高效的智能模型计算、精准的信息资源服务和人性化的自然语言交互。在应用场景方面,ChatGPT 可以被用于虚拟馆员智能问答、虚拟讲解员、阅读推广服务以及特殊人群无障碍服务等方面。针对这些应用场景,本研究从技术支撑、信息资源、服务场景和管理制度方面提出实践路径,明确图书馆虚拟数字人服务治理发展方向,充分利用 ChatGPT 技术去整合、搜集、加工和应用资源,以实现ChatGPT 赋能图书馆虚拟数字人技术的全面应用。 近年来,人工智能以及元宇宙的快速发展和广泛应用不仅深刻改变了我们的生产和生活方式,也为图书馆事业带来前所未有的机遇和挑战。本文在 hatGPT 赋能图书馆虚拟数字人的技术优势、应用场景与实践路径方面进行了初步的探索,在未来更深入的研究中,将借助 ChatGPT 的插件,构建图书馆虚拟数字人原型系统,探索系统的数据支持、可行性验证和效果评估。通过数字技术和人工智能技术的结合,图书馆虚拟数字人将实现从传统服务模式向智慧化服务模式的跨越,为用户提供更高质、更高效的服务。这也为图书馆学界提供了新的研究支点,共同开创数智融合下图书馆虚拟数字人新进路。 [1]郭亚军,庞义伟,周家华等.ChatGPT赋能图书馆虚拟数字人:技术优势、应用场景与实践路径[J/OL].图书馆论坛:1-11[2023-07-11].

    发布时间: 2023-07-11

  • 21. 新媒体环境下老年群体在线虚假信息识别行为 关键影响因素研究
    程冰
    【目的/意义】新媒体环境下的虚假信息泛滥问题给老年群体融入媒介化社会带来了巨大阻碍,分析老年群 体在线虚假信息识别行为的关键影响因素,对优化社交媒体平台运营管理以及促进老年群体融入媒介社会具有一 定参考作用。【方法/过程】基于半结构化访谈获得原始资料,按照扎根理论三级编码流程构建新媒体环境下老年群 体在线虚假信息识别行为影响因素模型,并借助模糊 DANP 方法明确因素间的影响关系并量化关键影响因素权 重。【结果/结论】结合影响因素的极限超矩阵和中心度、原因度排序位次识别出信息来源、验证渠道、信息茧房效应 等老年群体在线虚假信息识别行为关键影响因素并提出了应对策略。【创新/局限】本文借助扎根理论构建老年群 体在线虚假信息识别行为影响因素模型并采用模糊DANP方法识别了关键影响因素,能为相关平台的服务优化提 供一定参考启示。后续研究期望选取特定的社交媒体平台或者细化具体研究情境,以进行更深入的探讨。

    发布时间: 2025-07-23

  • 22. 主流研究数据存储库的数据管理与FAIR遵循:一项探索性研究
    程冰
    2025年6月10日(在线发布时间为3月3日),Data Technologies and Applications期刊发布一项研究,基于 FAIR 原则制定了一份专门的检查表,用以评估研究数据存储库的功能和服务。本研究考察了四个研究数据存储库(RDR)的特征和服务,包括Dataverse、Dryad、Zenodo 和 Figshare,探讨了这些 RDR 是否遵循 FAIR 原则,并提出了需要添加的特征和服务以增强其功能。本研究基于 FAIR 原则,采用专门设计检查表方法,用于评估四个主流RDR 的特征和服务,最终检查表包含11个构念,199个检查点。研究显示,Figshare在可发现性、可访问性、互操作性和可重用性方面获得了最高的特征分数。Figshare在 11个构念中有6个构念的特征得分最高,以116 分(58.3%)获得最高分,排名第一;Dataverse 以90分(45.2%)排名第二;Zenodo以86分(43.2%)排名第三;Dryad的特征得分最低,为85分(42.7%)。此外,研究发现这四个流行的研究数据存储库在“研究数据访问指标”特征(23.3%)和“输出、数据许可及其他高级特征”(22.6%)方面表现较差。在“RDR 中的服务”类别中,特征得分最低,仅为15.9%。这三个构念下的特征需要升级,以提升这四个流行研究数据存储库的功能性。该研究为研究人员选择合适的研究数据存储库(RDR)以访问和共享数据提供了重要参考,同时,也可助力数据科学家、图书馆员和政策制定者在学术及研究机构开展研究数据管理服务,该辅助培训研究人员和教职员工的研究数据素养。

    发布时间: 2025-07-23

  • 23. 第四次工业革命时代公共图书馆中用于变革性信息服务的机器人技术与人工智能(AI)
    程冰
    公共图书馆作为传统的学习和素养中心,正在被第四次工业革命(4IR)中的机器人技术和人工智能(AI)重塑。本文综述了 AI 和机器人技术(如书架巡检机器人、人形机器人、聊天机器人和语音激活系统)如何提升图书馆服务。这些技术简化了运营流程,提高了效率,使图书馆员能够专注于以人为本的任务。早期采用者展示了其将图书馆转变为动态、响应迅速机构的潜力。研究结论认为,整合机器人技术和人工智能能够重新定义公共图书馆,在先进技术与熟练人类专业知识之间实现平衡,以满足不断变化的信息需求。

    发布时间: 2025-07-23

  • 24. Practicing Meta-Analytics with Rectification
    程冰
    摘要:本文展示了使用Higgins方法评估元分析中同质性的重要性。研究人员意识到在元分析工作中评估同质性的重要性。Higgins方法存在一个显著问题,本文解释了该问题的性质,并提出了解决方案。我们在本文中的叙述旨在指出问题、分析问题并清晰呈现。检查元分析中可比研究结果一致性的前提是研究应为同质性,而非异质性。Higgins ??2分数,作为Cochran Q值的一种版本,通常用于评估异质性。Higgins分数是对Q值的改进。然而,Higgins分数在统计上存在问题。Higgins分数应遵循卡方分布,但当Q分数小于自由度时,卡方分布将失效。最近,这一问题通过一种替代方法(??2分数)得到了修正。使用该方法,我们检查了14篇已发表的文章,代表133个数据集,并观察到许多被Higgins方法声明为同质的研究实际上是异质的。本文敦促研究界在使用Higgins方法进行推断时要谨慎。 关键词:同质性;Cochran的Q分数;H2分数;Higgin I2分数;S2分数;系统综述;元分析 Shanmugam, R., & Singh, K. P. (2025). Practicing Meta-Analytics with Rectification. Publications, 13(1), 2. https://doi.org/10.3390/publications13010002

    发布时间: 2025-07-23

  • 25. 古汉语命名实体识别国际评测顺利举办
    程冰
      中国社会科学网报道,5月4日,古汉语命名实体识别国际评测(EvaHan2025)研讨会线上线下同步举行。   古汉语命名实体识别国际评测是专注于古代汉语的命名实体识别任务展开的技术评测比赛,目的是基于当前学界已有的古代汉语命名实体识别研究成果,探索大语言模型对古汉语的处理应用,与海内外高校、研究单位合作,共同推进古代汉语自动分析技术的研究。   会议邀请著名计算语言学家、新疆大学中国语言文学学院教授冯志伟做了题为“古汉语文本命名实体识别”的特邀报告。报告回顾了古汉语信息处理的概貌,指出古汉语文本在繁简字、标点与命名实体方面存在的特殊困难,以及当下的大语言模型对古文处理还较为薄弱的现状,提出古文命名实体识别是一项非常关键而迫切的研究任务。   李斌作了古汉语命名实体识别国际评测(EvaHan2025)总体情况报告,介绍了四家单位建设标注数据的艰辛历程,总结了十多个参赛队的技术特点和评测的三点主要结论:史传类古籍的六类命名实体中,人名、地名、时间、职官的识别效果好,而书名和国名还有待提升;中医古籍中的六类命名实体中,饮片、方剂、穴位的识别率较高,而证候、疾病和症状的识别率还较低;大语言模型对原文的随机修改是需要特别注意的问题。   研讨会期间,10支参赛队分别作了技术报告,展开交流与讨论。经过综合评比,蜜度科技股份有限公司—中国人民大学团队获得一等奖,南京大学团队和武汉大学—北京大学团队获得二等奖,多伦多大学—曼彻斯特大学团队和东北林业大学两个团队获得三等奖。冯志伟表示,本届评测有效地提升了古汉语特别是中医古籍中的命名实体效果,对挖掘古籍中的文化珍宝十分有益。李斌对各参赛队表示感谢并提出,未来还将举办更多古汉语的国际评测,推动古籍的保护和传承创新。   中国古代典籍浩如烟海,蕴含着深厚的史学与文学价值,是世界文明的瑰宝。为了更好地开发和利用古籍资源,传承并弘扬中华优秀传统文化,对古籍进行数字化深加工处理显得尤为重要。在古籍数字化加工的过程中,人名、地名、职官等命名实体标注是关键的一环,尤其是有着重要医疗价值的中医药方、证候等实体。如果根据传统方法,仅依靠专家学者手工完成命名实体标注,不仅耗费大量人力物力,还难以满足规模化处理的需求。因此,面向古汉语的命名实体识别工作,在推动古籍的创造性转化与创新性发展,以及促进中华文化的传承与传播方面,具有重要意义。目前,古汉语命名实体识别的研究尚未成熟,缺乏统一的评估体系和规范化的评测方法,推动标准化的古汉语命名实体识别评测显得尤为迫切和必要。专门针对古汉语的系列国际评测(EvaHan)将在2025年的评测中重点聚焦这一领域,力求建立高质量的数据集和统一的评测机制,推动古汉语命名实体识别研究的系统化和规范化发展。   据介绍,该评测由中国人工智能学会主办,南京师范大学文学院、南京师范大学语言大数据与计算人文研究中心、南京农业大学信息管理学院、南京理工大学经济管理学院、中国中医科学院中医药信息研究所联合组织。在5个月的时间里,2024年12月发布训练数据,2025年2月15日—22日正式开赛,2月底提交技术报告,3月中旬完成论文修改,5月4日举行评测研讨,线下会议地点在美国新墨西哥州阿尔伯克基市,是北美计算语言学大会NAACL2025子会议第二届古代语言处理研讨会(ALP2025)的重要组成部分。共有来自加拿大、法国等海内外高校的23支队伍报名参加评测,最终有13支队伍完赛。

    发布时间: 2025-07-23

  • 26. 第六届世界媒体峰会:人工智能与媒体变革
    程冰
    2024年10月12日至17日,第六届世界媒体峰会在新疆乌鲁木齐举行。本次为期6天的峰会聚焦“人工智能与媒体变革”主题,分析了人工智能技术快速发展给世界传媒业带来的机遇和挑战,探讨媒体在新一轮科技革命和产业变革中的角色和责任,共商如何更好讲好世界现代化建设的故事,推动全球共同发展。 随着人工智能技术的突飞猛进,我们正在经历一场内容创作、分发和消费方式的革命性变革。将新技术及时融入媒体工作不仅是时代的要求,也是媒体行业受众的需求。在图像和语音识别、自然语言处理等关键领域,人工智能的应用为媒体行业带来了前所未有的创新工具和表现形式。 然而,随着技术的不断深入,我们也面临着一系列新的挑战。数据隐私保护成为一个亟待解决的问题,因为人工智能系统需要大量用户数据来优化其算法,这可能引发用户对个人隐私泄露的担忧。信息的真实性验证也变得越来越重要,因为人工智能技术同样可以被用来制造逼真的假新闻和深度伪造视频,这对社会的信任体系构成了威胁。虽然人工智能存在黑箱、算法偏见、伦理治理等问题,会给社会带来挑战,但是纵观科技发展,人工智能等新兴技术会为我们的社会构筑新底座、定义新范式、探索新方式。 此外,机器与人类工作者之间的协作关系也变得复杂,人工智能的广泛应用可能会改变工作性质,引发就业市场的动荡。同时,此次会议也成为新疆一段时间以来对外发声的平台,新疆维吾尔自治区党委书记马兴瑞在开幕式上致辞并表示,此次峰会既是全球传媒界的盛大聚会,也是实地了解中国新疆的重要窗口。最后,新华通讯社副社长发布了《第六届世界媒体峰会新疆共识》。共识强调,人工智能治理攸关全人类命运,是世界各国面临的共同课题,迫切需要深入探讨,凝聚共识,共抓机遇,共克挑战;全球媒体应当合理运用人工智能新技术,讲好人工智能赋能可持续发展故事,推动人工智能更好服务全球发展、增进人类福祉;面对人工智能技术快速发展的时代下,应始终坚持新闻伦理和专业标准向受众传播真实、客观、全面、公正的新闻消息。我们相信,本次世界媒体峰会将促进全球媒体凝聚广泛共识、深化交流合作,助推世界各国共享人工智能发展成果,同行高质量发展之路,为推动构建人类命运共同体、建设更加美好世界汇聚强大媒体力量。

    发布时间: 2024-10-31

  • 27. 日本总务省:中国对ChatGPT等生成式AI应用,全球第一
    程冰
    日本总务省官网发布2024年(令和6年)生成式AI应用白皮书。 主要查看了日本公民对ChatGPT、Coplilot、Midjourney、Stable Difusion、Gen-2、MusicGen等10多种生成式AI的应用情况,同时对美国、中国、英国和德国的全球主流使用国家进行了横向调查和对比。 结果显示,中国以56.3%的使用率排名第一;美国46.3%排名第二;英国39.8%排名第三;德国34.6%排名第四;日本9.1%第五。在企业对生成式AI的应用方面,中国以71.2%大幅度领先同样排名第一。 这个调查结果与上周美国SAS发布的调查数据一样,也就是说中国凭借庞大的“原生数字人口”以及健康、积极的创新技术生态,在生成式AI产品场景化落地和应用方面领先美国、英国、日本等发达国家。

    发布时间: 2024-07-26

  • 28. 当地图书馆的故事揭示了前所未有的联邦资金削减所带来的影响
    王江宁
    (芝加哥,2025年6月25日)从蒙大拿州的安纳康达到纽约州的奥尔巴尼等地的社区故事,今日在美国图书馆协会(ALA)的“支持我们的图书馆”互动网站地图上得以生动呈现。这些故事展示了如果对农村、研究、城市、州立和大学图书馆项目(以及由此而带来的对全国数亿的图书馆用户的其他服务,如暑期阅读项目、远程医疗服务、图书馆间互借服务和电子书等)进行资金削减,将会产生的实际后果。 在与全国各地的读者、图书馆工作人员以及倡导者们的交流中,美国图书馆协会收集了相关故事,以更好地了解自总统于3月中旬宣布解散博物馆与图书馆服务协会(IMLS)的行政命令以来,联邦对图书馆资金的削减所带来的影响。 美国图书馆协会主席辛迪·霍尔表示:“这项行政命令扰乱了向家庭、学生、退伍军人、企业家以及其他图书馆用户提供的项目和服务的正常运作。”“我们从全国各地听到的有关图书馆的种种情况表明,联邦资金的削减将对全国大多数社区造成严重损害。向立法者讲述我们的故事对于恢复和维持美国图书馆服务联盟(IMLS)至关重要。” 故事包括: 一位15岁的女孩担心她在蒙大拿州安纳康达市的校外家庭图书馆将失去热点设施,这些设施能确保那些没有家庭网络连接的朋友们也能上网学习。 来自纽约州北部的研究人员开发了一种创新的教育工具,用于教授信息素养,这要归功于一项即将被暂停的IMLS资助项目。 内布拉斯加州的一个小镇图书馆正在考虑削减其综合图书馆服务和项目预算,以确保在联邦E-Rate项目终止时仍能保证互联网接入。 美国图书馆协会鼓励所有图书馆环境中的用户和专业人员分享他们亲身经历的图书馆影响故事,并将其提交给他们的选民代表以及美国图书馆协会,以进行公共宣传,这是其“现身支持我们的图书馆”倡议的一部分。倡导者可以向美国图书馆协会提交故事,并通过“现身支持我们的图书馆”网页与他们的国会议员联系。 美国图书馆协会(ALA)正敦促美国国会议员亲自走访为选民服务的图书馆,并投票支持在联邦预算中保留适度的图书馆经费。ALA呼吁所有重视阅读和学习的美国人与当选领导人取得联系,并在图书馆和学校董事会会议、市政厅会议以及所有涉及图书馆决策的场合“现身支持我们的图书馆”。

    发布时间: 2025-07-23

  • 29. 中国国内医学相关的类GPT语言模型
    闫亚飞
    1、华佗GPT 华佗GPT 有免费体验网站,可直接访问对话,无需注册登录账户。目前处于测试阶段,还在不断完善优化中,由香港中文大学(深圳)和深圳市大数据研究院联合开发。 是一个基于大量中文医疗语料训练的大语言模型(LLM),目的是让语言模型具有医生的专业知识和患者的友好态度,为医疗咨询场景提供便捷有效的服务。目前处于测试阶段,生成结果正确性目前没有额外机制保证,结果仅供参考,请遵医嘱。界面中有上传图片和语音按钮,但这两个功能实际效果如何还待验证。 2、左医GPT 左医医疗大语言模型 不免费,但可申请短期体验。该对话页面需要用API key,底部有API key申请平台入口,在平台通过客服或联系电话或企业微信号等多种方式申请可获得key,申请就直接给,会给一个有试用期的API密钥,在左医GPT对话页面输入即可体验。目前主要对医院等医疗相关单位机构合作使用。我上次申请体验的是有2天试用期,不知现在能试用多久。 补充:百度搜索“左医GPT”,有介绍,平台申请直接获得key,因为医疗比较严肃,所以加一道,保证使用安全。——来自本文评论区 张超(左手医生创始人 CEO) 左医GPT不是基于GPT-3的,而是基于Transforme架构的自研模型。听译机器人的底层技术用的是左医GPT,和openAI没有任何关系。可通过语音识别和自然语言理解技术,实时记录医患对话,并自动生成电子病历。还可通过语言模型和知识图谱技术,为医生提供智能辅助功能,如用药指导、诊断建议、随访管理等。左医GPT是左手医生公司的核心产品之一,目前已经部署在全国近百家头部医院,提供智慧服务。 官网产品介绍地址(可申请API key) 左手医生开放平台-助力智慧医疗服务建设 3、岐黄问道GPT 大经中医岐黄问道大模型 (dajingtcm.com) 中医大模型,大经中医出品。目前对医疗机构开放申请内测。三个子模型:基于已确诊疾病的临床诊疗大模型,仅基于症状体征的临床诊疗大模型,中医养生调理大模型。 落地应用:在“学习强国”App中的中医智能健康助手就是基于此模型,只需要选择一些不舒服的表现,就能推荐中医调理方案。广东省中医院、上海中医药大学附属龙华医院等医疗机构单位;南京市江宁区、淄博市高青县等区域中医医联体,上海长宁区“为老服务中心”,下沉到山东吉林等地村卫生室这种基层医疗机构。 训练呢数据集:1100万条中医知识图谱数据;1500本中医古籍和文献数据;10万份真实中医专家医案数据;10万条脉象、舌象、经络、穴位数据;200万条真实的中医临床诊疗数据。 大经中医官网:大经中医 (dajingtcm.com) 4、本草(别名华驼,另有Med-ChatGLM) 中医大模型,免费开源,但目前无法直接使用,需下载在高性能计算机上进行复杂本地部署,也没有线上网站可体验。 哈尔滨工业大学开发的一款基于中医药知识图谱的人工智能系统,可提供中医药相关的问答、推理、分析等服务,赋能中医药行业的各个场景。 项目介绍地址(需翻墙才能访问) 本草(华驼) https://github.com/SCIR-HI/Huatuo-Llama-Med-Chinese Med-ChatGLM https://github.com/SCIR-HI/Med-ChatGLM 5、医联MedGPT 公司官网 成都医云科技有限公司 (medlinker.com) 个人无法直接使用,目前与各大医院及机构合作面向患者使用。是国内首个进行线下医院实际问诊等流程场景使用测评的大模型。已进入内部测试阶段,2023年5月正式发布。已拥有近3000种疾病的首诊能力,覆盖80%以上的成年人疾病和90%以上的0-12岁儿科疾病。突破AI医生无法与真实患者连续自由对话的难点,并在医疗问诊场景中支持多模态的输入和输出,在疾病的预防、诊断、治疗、康复四个重要环节全面实现智能化。MedGPT模型相关介绍文章如下: 文章一:医疗版ChatGPT直播评测!治疗方案与真人医生96%一致 文章二:鏖战一天,与三甲主治医师医学一致性达到96% 医联 MedGPT 通过首次公开大考! 在微信公众号“医联Medlinker”中有个“医联MedGPT 媒体沟通会”的发布会视频,里面详细讲解了模型具体情况。 6、砭石 中医大模型,不免费,可简单体验。智慧眼开发的医疗领域大模型砭石,是一款支持多模态(文本、图像、视频和音频)输入的人工智能医生,可以提供智能问诊、辅助诊断、智能用药等服务,赋能医疗健康行业的各个场景。 体验方法:扫描智慧眼官网上的二维码,体验互联网医院的服务,包括智能导诊、在线问诊、处方流转、药物配送等。扫描后进入小程序进行微信登陆,添加就诊人并实名认证,后自动跳转到“急速问诊”页面,该问诊就是基于砭石模型问答。下次再次使用时在小程序首页上的“问诊购药”或“复诊续方”功能按钮进入问答界面。("砭"读bian一声) 产品介绍官网(页面下滑找到微信小程序二维码) 智慧眼-人工智能/医疗健康-AI计算驱动生命健康 7、京东JDH 京医千询 基于京东自己的言犀大模型打造,投喂了京东互联网医院积累了上亿级的医疗问诊数据。远程医疗两个场景:一是药师的问答;二是医患问答。目前与互联网医院及医疗机构合作面向患者使用,个人目前无法直接使用。没有找到官网相关链接及信息,欢迎评论补充。感兴趣的可通过京东云网站客服等渠道咨询就行。 京医千询_百度百科 (baidu.com) 8、腾讯健康医疗大模型,面向B端医院企业商业,不对个人开放,官网:腾讯健康 9、百度灵医智惠,面向B端医院企业商业,不对个人开放,官网:灵医智惠 10、华为云盘古医疗,网址:盘古大模型_panguLM_大模型_华为云,药物分子大模型,医疗大模型。 11、清华药物研发助手ChatDD,详情介绍网址:水木分子发布ChatDD 新一代对话式药物研发助手,引领药物研发第四范式 将于2023年10月中旬邀请测试基础版本。清华系初创团队水木分子宣布发布新一代对话式药物研发助手ChatDD(Drug Design),覆盖药物立项、临床前研究、临床试验的各阶段,作为制药专家的得力AI助手,提升药物研发效率。千亿参数多模态生物医药对话大模型ChatDD-FM 100B。“制药版 ChatGPT”。兼具多模态和对话双重特点,能给医药界学生“解个惑”。主要给国内医药行业“打辅助”,侧重中文对话能力,融入了更多专家的对话模式和经验。 12、清华BioMedGPT,项目开源地址:https://github.com/taokz/BiomedGPT 生物医药版ChatGPT。清华大学聂再清教授带领团队着手构建的多模态生物医药领域基础模型,旨在将生物世界分子、文本与知识进行统一表示学习以达到在各项下游任务上能力的整体提升。通过打造的干湿闭环和专家在环的双闭环体系,使得BioMedGPT能够从真实世界学习、向人类专家学习有望成为生物医药研发基础大模型,支撑诸如高通量虚拟筛选、分子生成与优化、个性化药物重定位、生物医药知识检索等多项应用。主要用于科研领域,更擅长英文生物医药科研任务,适合直接拿来作为生物医药领域的相关科研任务的基础模型。

    发布时间: 2023-12-01

  • 30. 面向高质量本科人才培养的信息素养教育创新探索
    杨小芳
    摘要 这篇论文主要介绍了清华大学图书馆在本科人才培养中创新信息素养教育实践和思路,以支持高质量人才培养。 方法 以清华大学图书馆为例进行介绍。 优化规划设计,加强面向拔尖创新人才的课程建设。 积极拓展合作,深度支撑大学人才培养。 开展项目式创新实践探索,助推人才培养。 结论 通过介绍清华大学图书馆在本科教育中的信息素养教育创新实践和思路,探讨了如何将信息素养教育融入大学人才培养生态体系,以支持高质量人才培养。

    发布时间: 2023-12-01

  • 31. 基于DEA方法的科学数据共享平台服务科研效率评价:以中国国家科学数据中心为例
    程冰
    2025年6月12日,《研究评价》期刊发表了一项关于数据平台服务科研效率的评价研究。科学研究日益凸显科学数据的重要性,此趋势催生了科学数据共享平台,这些平台负责管理科学数据并促进数据资源的开放共享。本文旨在评估这些平台在支持科研中的效率,将研究评价的分析视角从传统的以主体为中心扩展到以平台为导向。本文构建了基于数据包络分析(DEA)方法的两阶段效率评价模型,并提出通过调整系数减轻异质性对评价结果影响的方法。以中国国家科学数据中心为案例进行了实证研究。根据本研究的计算结果和发现,建议国家科学数据中心建立以阶段效率为优先的差异化资源优化机制,以契合数字经济时代基于平台的科研范式制度需求。 国家科学数据中心应建立学科差异化的数据服务策略。建议将动态评价的效率结果与标杆中心的经验相结合,对数据中心进行分类优化,解决技术缺陷和管理瓶颈。

    发布时间: 2025-07-23

  • 32. 不负“一流”使命 闯出科技期刊中国道路
    杨小芳
    一部科技期刊史,见证壮阔科技史。自1665年英国皇家学会创办世界上第一本科技期刊《哲学汇刊》以来,科技期刊便成为科技大事件的重要推手,世界一流科技期刊更直接体现国家科技竞争力和文化软实力。 正因为如此,着力打造世界一流科技期刊,被置于创新型国家建设的突出位置。 建设世界一流科技期刊,引领我国科技期刊由大向强,我们的“底子”如何,“底气”何在,具备怎样的“底蕴”,又该如何加固“底层”?科技日报记者为此进行了深入采访。 底子:世界科技期刊前列增添许多中国身影 “我国已成为期刊大国,但缺乏有影响力的世界一流科技期刊。”这是2019年中国科协、中宣部、教育部、科技部联合印发的《关于深化改革 培育世界一流科技期刊的意见》(以下简称《意见》)在开篇语里作出的判断。 随着几年来的实践,人们已经发现,世界科技期刊前列增添了许多中国身影。数据分析公司科睿唯安2023年公布的《期刊引证报告》(JCR)显示,中国期刊《细胞研究》影响因子达到44.1,蝉联世界影响因子百强期刊。《电化学能源评论》《分子植物》《园艺研究》《先进陶瓷》等多个中国科技期刊位居本学科领域影响因子全球第一。近几年SCI收录的期刊总量增长了不到4%,而中国进入SCI期刊数量增长了25%。 然而,这是不是意味着我们离建设世界一流科技期刊已经不远了呢? “世界一流期刊必须是能够持续、集中地刊登某一个学科或多个学科的具有世界一流水准的科研成果的载体,其论文必须对学术、技术、产业等某个方面或某几个方面产生重大影响,能够引领某个领域,甚至对人类的进步、社会的发展产生较大影响。”凝聚态物理学家、中国科学院院士朱邦芬曾对世界一流期刊的内涵和外延作出这样的表述。就客观情况看,我国的科技期刊在“重大影响”和“较大影响”方面还有不小的差距。 据《中国科技期刊发展蓝皮书(2023)》(以下简称《蓝皮书》)统计,2022年中国作者发表SCI论文总数,是中国SCI期刊发表论文数的19倍多。这意味着大量中国作者的成果发表需要依靠海外科技期刊,我国科技期刊对一流成果的承载能力还远远不够。 同时,《蓝皮书》也显示了当前我国科技期刊出版“小而散”的处境。截至2022年底,中国科技期刊总量为5163种,分属于3218个主办单位。77.13%的主办单位仅主办1种科技期刊。这些飘散四处的星星之火,尚需汇聚以成燎原之力。 如今,在国际上,科技期刊向大型出版机构集中已成明显趋势。为了提升市场占有率,国际大型出版机构不断强化集群化发展。以施普林格·自然集团为例,截至2022年,其旗下的《自然》子刊就有65种,几乎覆盖了所有的学科领域,同时还以每年3种子刊的速度扩张。 近年来,我国科技期刊的集群发展在平台加持下已显加速之势。截至2023年,中国科学院主管主办期刊已达到400余种,自有的SciEngine平台技术建设和资源集聚初具规模,包含近450种期刊、39万余篇论文,总下载量超过3800万次。中华医学杂志社搭建运营的“中国临床案例成果数据库”已覆盖来自全球30余个国家的读者。 建设世界一流科技期刊群,还期待更多“高原”的崛起,教育部科技委学风建设与科学传播专门委员会委员、中国高校科技期刊研究会理事长张铁明说:“目前国内的科技期刊建设滞后于高水平科技自立自强,期刊对于国家科技创新的支撑和服务作用还有很大差距,这也是期刊人正在努力改变的现状。” 底气:中国已经具有国际一流的稿件源和作者群 2022年,我国全社会研发经费支出首次突破3万亿元,研发投入强度首次突破2.5%,基础研究投入比重连续4年超过6%。夸父探日、青藏科考、微纳卫星、量子传输、质子治疗等一批重大创新成果竞相涌现……如今我国不仅是国际前沿科技创新的重要参与者,也是共同解决全球性问题的重要贡献者。 “中国已经具有国际一流的科技稿件源,这将为建设世界一流的学术期刊提供稿件源和作者群基础。”中国科学院院士、世界一流科技期刊建设专家委员会主任杨卫对此充满信心。 中国科学技术信息研究所发布的《2023年中国科技论文统计报告》显示,2023年,我国各学科最具影响力期刊论文数量首次升至世界第一,高水平国际期刊论文数量及被引用次数均排在世界第一。这表明,我国科技论文质量已经发生跃升。 面向世界科技前沿,有可裸眼观察遗传转化的植物通用性便捷报告系统;面向经济主战场,有智能网联汽车关键技术;面向国家重大需求,有降低电磁污染的新型导热屏蔽复合材料;面向人民生命健康,有针对抗新冠病毒候选药物筛选实验性研究成果……我国科技期刊正在快速抓住这些一流成果评鉴和记录的主动权。 国家对科技期刊的政策支持,带动和引导了一批科技期刊的高质量发展。进入21世纪以来,国家相关部门先后推出“精品科技期刊工程项目”“中国科技期刊国际影响力提升计划”“中国科技期刊卓越行动计划”等一系列专项财政支持项目。中国科协科学技术创新部部长刘兴平在2023年中国期刊高质量发展论坛上指出,2018至2022年,经过五年的发展,我国国际学科排名进入Q1区(前25%)的期刊增加了99种,学科排名居于前5%的增加了45种,排名学科前三的增加了28种。其中,15种期刊学科排名位居第一,4种期刊影响因子超过30,进入全球百强。 曾经“借船”出海的期刊,也在探索归国自主“造船”之路。2022年12月,多次蝉联本领域影响因子世界第一的《先进陶瓷》,结束了与施普林格·自然集团长达11年的合作,转为依托清华大学出版社自主研发的学术期刊数字化国际出版平台SciOpen。 “要办就办世界一流!不是关起门来办一流,而是到世界上争一流,这是我们共同践行的办刊理念。”清华大学出版社副总编兼期刊中心主任石磊告诉记者:“清华大学科技期刊群目前有45种期刊,出版内容已覆盖清华大学60%的‘双一流’学科,在信息科学、纳米科学等领域已经形成一定的出版规模、品牌特色和国际影响力。我们要把内容集群化和平台智能化结合起来,努力为国家高水平基础科学支撑平台和开放创新生态体系建设作出更多贡献。” 一流学科、一流期刊和一流科学家,正在形成协同发展的纽带关系。“中国海洋大学拥有12个ESI前1%的学科,每个学科领域在我校海洋特色学术期刊群中,都有至少2种学术期刊提供学术支撑,形成了特色优势学科与学术期刊融合发展、相互支撑的关系。”中国海洋大学期刊社社长杨立敏介绍道,正是这样的“通力合作”,才使得创办《海洋生命科学与技术(英文)》4年来,影响因子就达到5.7,在海洋与淡水生物学领域全球排名第五。 来自湘江两岸的例子也可以成为印证。中南大学拥有世界上最完备的“地采选冶材”有色金属学科体系链。翻开其《中国有色金属学报》的红色封面,一页长长的编委名单映入眼帘。 “创刊至今的32年时间里,这份名单中已经产生很多院士。现在,我国有色金属行业的院士几乎都在这份名单上。世界一流的学科群和科学家,给了我们建设世界一流科技期刊的底气。”中南大学出版社副社长杨保华说。 底蕴:中国科技期刊正处于科技回答时代之问的重要时期 1898年,居里夫妇发现了新元素钋,两人合写了论文《论沥青铀矿中所含的放射性新物质》。他们在投给法国科学院《论文汇编》发表之前,就已经把原稿寄回祖国,用波兰文发表在华沙的画报月刊《斯维阿特罗》上,让她的同胞能第一时间看到成果。 1926年,清华国学研究院和美国弗利尔艺术馆,就李济、袁复礼主持的山西夏县西阴村田野考古发掘达成协议,约定论文要用中英文撰写并在中美两国学术刊物上发表,这在当时难能可贵。科学家对祖国的热爱深深地投射在世界一流科技成果上,科学家精神深嵌在科技期刊的骨子里,今天依然在赓续。 港珠澳大桥已开通5年,不仅为粤港澳大湾区的互联互通奠定基础,更创造出世界工程技术领域多个第一。“聚焦高铁、桥梁等‘中国超级工程’的学术论文,或许引用率不是很高,但它记载了我国一线科技工作者的创新成果和研究进展,解决了一些世界性难题,国际上是非常关注的。”杨保华告诉记者。 “立足国情、面向世界,提升质量、超越一流。”翻开《意见》,第一部分写着这样16个字。当科技发展正在回答时代之问,科技期刊又该怎样呈现?科技期刊能否从成果发布交流平台升级为支撑国家科技创新的基础性平台? 近年来,中国科学院分子植物科学卓越创新中心主办的《分子植物》正在尝试把中国的科研成果和中国元素共同制作成杂志封面,推动中国的科研成果和文化同时走向世界。《中国科学院院刊》作为中国科学院高端智库的“名片”,为中国科学院的发展、国家宏观战略与决策的制定发挥了导向和支撑作用。《航空学报》走进一线科研机构,围绕“卡脖子”技术策划出版“大飞机专刊”“空间机器人专刊”等几十个重磅专刊或专栏,获得业界高度认可。《清华大学学报(自然科学版)》组织了“港珠澳大桥”“智能建造——白鹤滩、乌东德水电站”“天眼(FAST)运行维护中的关键技术”等专题或专刊,探索高校学报“开门办刊”之路。《煤炭科学技术》走进国家能源集团、山东能源集团等生产一线,开展煤炭科技大讲堂、科技论文写作培训活动100余次,助力生产一线科技成果产出…… 世界一流科技期刊建设的中国道路正在慢慢铺就,也牵动着更多思考。中国科学院院士、古鸟类学家周忠和研究员在《科学通报》刊文指出,在比较长的一段时间内,中文、英文期刊各自承载不同功能,应当明确自身定位,并充分考虑哪些具体研究具有区域、文化的独特性。 杨保华认为,科研工作坚持“四个面向”,我国科学家解决的很多本土问题都是世界性难题。期刊核心竞争力应该由其发表论文的原创性、创新性、前沿性决定,而不是由语种和国别决定,这是我国中文和英文科技期刊都应该保持的态度和定力。 中国科学院自然科学期刊编辑研究会秘书长刘筱敏告诉记者,开放、交流是科学与生俱来的本质属性和文化基因。数字技术的发展提供了更多方法可以跨越语言障碍。我国中文和英文期刊都需要进一步增强对国内外学者的吸附能力,汇聚更多优秀科研成果,健全自主可控的学术交流渠道,进行全球范围的传播,让科研成果惠及全球发展。 “我国的科技期刊已经取得了很大成绩,但比起我们所肩负的历史使命、时代使命、科学使命、国家使命,还是任重而道远。”在2023上海科技期刊高质量发展大会院士圆桌会议上,中国科学院院士、《细胞研究》前主编裴钢谈道。 底层:同向发力不断夯实建设世界一流科技期刊的基础 记者在采访时,多位期刊界人士谈了自己的体会:建设世界一流科技期刊,当务之急是提高期刊的编辑素养和编辑的科技专业水平;基础是一流人才支撑和动能激励机制;关键是创新前沿关注和选题视野;重心是科学表达和平台传播;要害是评价的专业性和影响力;本质是创新成果的引领力和论文发表的吸附力。 中国科协学会服务中心提供的数据显示,2022年,我国442种英文科技期刊中,403种依赖海外平台出版。“单刊与国际出版集团合作,大多处于依附地位,在研发、销售等高附加值环节没有主动权,难以获得规模化发展效益。”有科期刊出版(北京)有限公司董事长钱九红坦言。 “单纯靠逐步创办新刊来增加办刊数量的方式效率低、成本高,难以实现快速规模化发展的目的。”她建议,“加强顶层设计,从国家层面推动科技期刊的集团化、集约化发展,加大对出版单位集群化、集团化发展的政策支持,鼓励跨地域、跨部门办刊,支持期刊出版单位找准定位,探索构建资源深度融合发展的创新模式。” “好的机制创新,就会让道路走得更宽阔一些。”《园艺研究》主编程宗明建议,一流科技期刊培养编辑人才不仅需要期刊发挥能动性,更重要的是健全的激励机制和广阔的成长空间,让期刊编辑人员更有归属感。同时,中国科技期刊要兼顾学术声誉和商业价值。此外,他期待能够提高我国科技期刊在科研成果评价中的应用。 《园艺研究》自2018年起,开始尝试利用社交媒体建设学术社区,打造建立在高质量期刊基础上的学术生态圈。5年后的今天,该期刊已经建成一批成熟的学术交流社群,通过学术交流社群招募云实习编辑等举措,探索逐步引导科研人员从“读者—作者—协同工作人员”的身份转变和流动。 “我们编辑部6个人,做着3本刊物。人手紧张,我们就创新机制,吸引大家自建自治。”程宗明介绍。 中华医学会杂志社社长魏均民一语道破当前的发展瓶颈:“优秀的期刊出版人才,尤其是复合型期刊出版人才、优秀英文编辑相对不足。”据《蓝皮书》分析,我国刊均从业人数集中在4—7人区间的期刊占45%。 我国期刊编辑往往不仅要做前端的选题策划,还要兼顾后期的宣传,从头做到尾。杨保华指出,“没有专业化的人才分工、完善的人才体系,编辑个人的专长优势就很难发挥出来”。人才是基础问题,中国科技期刊要面临的考验还很多。 在11月23日公示的2023年度卓越行动计划优秀人才案例遴选汇编项目拟入选案例中,优秀主编人选不乏梅宏、饶子和、王恩哥等中国科学院院士,记者还欣喜地看到《科学通报》《森林生态系统》《工程》等期刊的优秀管理人。卓越项目孵化的期刊人才底层架构渐成体系。 中流击水时更需“弄潮”。新时代科研范式的变革,更需期刊人从整体、开放和系统的维度共同营造期刊生态。中国高校科技期刊研究会秘书长张昕认为,加快建设世界一流科技期刊,是文化自信尤其是创新文化自信的体现,而创新文化自信正是创新型国家建设的“精气神”。据了解,于11月29日在南京召开的第十八届中国科技期刊发展论坛,将围绕“开放 信任 合作——科技期刊助力高水平科技自立自强”主题,进行深入探讨。 不负“一流”使命,在关注世界一流科技成果上闯出科技期刊中国道路。把论文写在祖国大地上,中国的科技期刊正朝着世界一流科技期刊目标蝶变。 原载于《科技日报》2023年11月29日5版(《深瞳》)

    发布时间: 2023-12-01

  • 33. 引用功能感知的知识单元引用网络构建与多维分析
    程冰
    引用功能感知的知识单元引用网络构建与多维分析 针对知识单元引用网络中关联关系单一的局限,本文通过引用功能增强网络节点之间语义关联类型,提出一种引用功能感知的知识单元引用网络,并进行领域知识多维分析。首先对学术文本进行解析,抽取文献间引用关系、引文上下文以及引用对象等信息,并对引用功能和引用对象进行自动识别。在此基础上,采用复杂网络图方法构建引用功能感知的知识单元引用网络,从网络结构分析与可视化、知识单元多维引用关联分析、知识群落分析 3 个方面进行领域知识多维分析,并以国际计算语言学协会会议论文数据集为例进行实证研究。结果验证了本文所提出方法的有效性,发现了特定领域知识间使用、扩展和对比模式,丰富了知识群落的语义信息。本文扩展了知识单元引用网络的研究方法,深层次揭示了学科知识之间的语义关联,为学科知识结构分析提供了一种新的路径。 研究方法包括对学术文本的解析,抽取文献间引用关系、引文上下文和引用对象,并自动识别引用功能和引用对象。利用复杂网络图方法,构建了引用功能感知的知识单元引用网络,并从网络结构分析与可视化、知识单元多维引用关联分析、知识群落分析三个方面进行领域知识的多维分析。实证研究以国际计算语言学协会(ACL)会议论文数据集为例,验证了所提方法的有效性,并发现了特定领域知识间的使用、扩展和对比模式。 图表 1整体研究框架 文章还回顾了知识单元引用网络和语义功能感知的科学知识网络的相关研究,指出现有研究在语义功能增强方面的不足,并强调了从引用功能视角进行知识单元引用网络语义增强和分析的重要性。此外,文章也探讨了引文语义功能识别的相关研究,包括引用功能和引用对象的识别方法,以及这些方法在科学知识网络中的应用。 在研究方法部分,本文详细介绍了数据收集与预处理、引用功能与引用对象识别方法、以及引用功能感知的知识单元引用网络构建方法。数据收集涉及ACL会议论文集的全文文献,通过Grobid工具解析成xml格式,便于信息抽取。引用功能和引用对象的识别采用了BERT+Bi-LSTM+Attention模型和BERT+CRF模型,这些模型结合了深度学习和序列标注技术,以提高识别的准确性。 实验与结果部分展示了引用功能和引用对象识别的实验结果,以及网络结构分析与可视化的结果。实验结果显示,所设计的模型在引用功能识别任务上取得了高准确率,而在引用对象识别任务上,BERT+Bi-LSTM+CRF模型表现更佳。网络结构分析揭示了网络的稀疏性、平均度、平均加权度等特征,并通过Gephi工具进行了网络可视化。 研究成果指出本文提出的引用功能感知的知识单元引用网络能够细粒度地揭示领域知识间的关联关系,为科学知识图谱绘制和知识结构分析提供了新的视角。同时,文章也指出了研究的不足之处,如数据规模较小、对施引文献知识单元处理简单等问题,并提出了后续研究的方向。 本文通过构建和分析引用功能感知的知识单元引用网络,为理解和揭示科学知识发展变化的特征和规律提供了新的研究方法和视角。

    发布时间: 2024-11-22

  • 34. 高等院校人工智能素养教育的内容体系与发展理路
    饶海侠
    在第四次工业革命来临之际,培养具备人工智能素养的的各类人才逐渐得到重视,高校需要与时俱进,构建人工智能素养教育内容体系。2022年2月5日王奕俊、王英美、杨悠然在《黑龙江高教研究》期刊上发表《高等院校人工智能素养教育的内容体系与发展思路》一文。文章从素养连续统和人工智能技术两个层面阐释了人工智能素养,在对高等院校人工智能素养教育内容廓清的基础上提出了高等院校人工智能素养教育的发展理路。 一、研究内容 1.人工智能素养的释义 信息素养、数字素养和人工智能素养存在密切的关系,人工智能素养起源于素养连续统,是素养连续统在智能时代的拓展,更加注重强调伦理和思维的重要性。“知识”、“技能”、“意识”、“伦理”和“思维”是人工智能素养的重要组成部分。 2.高等院校人工智能素养教育的内容廓清 人工智能素养包括人工智能知识、人工智能技能、人工智能意识、人工智能伦理和人工智能思维。人工智能知识需要得到基本掌握,包括事实知识、原理知识、技能知识和知道是谁的知识;人工智能技能指的是识别、分析、应用和创造人工智能的能力;人工智能意识指的是对人工智能带来的双重影响的观点和态度,包括人工智能影响意识、需求意识和安全意识;人工智能伦理指的是要形成以人为本的价值认同,合法地、合乎道德地、安全负责地使用人工智能;人工智能思维指的是发展智能时代的一种高阶思维,核心是认知,强调计算思维和系统思维。 二、研究结论 高等院校人工智能素养教育的发展理路为以下四点。首先,研究与制定人工智能素养标准,为人才队伍的培养与建设提供依据;第二,革新人才培育理念,将人工智能素养教育与专业课程相结合;第三,完善人工智能素养课程建设;第四,提高教师人工智能素养,为人工智能素养教育提供重要保障。

    发布时间: 2024-07-26

  • 35. 【公示】2023年科技期刊世界影响力指数(WJCI)发布!
    于彰淇
    日前,中国科协课题成果《科技期刊世界影响力指数(WJCI)报告》2023版(以下简称《WJCI报告》)已预发布,报告的研制说明及评价指标详见http://wjci.cnki.net网站。 《WJCI报告》由中国科学技术信息研究所、《中国学术期刊(光盘版)》电子杂志社有限公司、清华大学图书馆、万方数据有限公司、中国高校科技期刊研究会、中国科学技术期刊编辑学会联合研制,是一份对全球科技期刊的评价报告。 该报告从全球正在出版的6万余种科技学术期刊中精选1.5万种为统计源,体现了地区代表性、学科代表性、行业代表性。在遴选统计源期刊过程中,课题组参考了期刊的总被引频次、影响因子、高被引论文数、高被引机构参与度等客观数据,并充分借鉴了国内外知名数据库和期刊评价机构成果,优化了统计源期刊的国家分布,更加客观呈现全球科技创新实景。 《WJCI报告》坚持期刊分类评价,分类体系在充分借鉴国际各数据库分类基础上,以国家标准为基础,细分学科进行期刊评价,并突出了前瞻性和实用性。为了反映学科交叉融合的发展现状,今年新增5个跨文理的学科类目,使期刊学科类别达到296个。在此分类标准下,《WJCI报告》2023版对中外期刊采用了统一的引证数据统计源、统一的评价指标计算方法的定量评价。 该报告发布的期刊评价指标——“科技期刊世界影响力指数(WJCI)”是基于影响因子、总被引频次、网络浏览和下载、新媒体关注量等数据的综合评价指标。详情请参见《研制报告》。 根据《WJCI报告》2023年版,收录中国期刊1772种,中国期刊的WJCI指数均值为1.487,居世界第八位。中国有130种期刊WJCI、总被引频次、影响因子学科排名位居全球TOP5%或学科排名TOP3。以下为130种期刊名单。

    发布时间: 2023-12-01

  • 36. 利用AI和公共数据集,低质量论文数量激增
    程冰
    2025年5月14日《科学》杂志新闻栏目报道,作者利用公共数据集和AI技术,导致低质量论文数量激增,论文工厂可能助长了“虚假发现”。 萨里大学统计学家Matt Spick发现,其担任副主编的《科学报告》期刊每天收到1-2篇高度雷同的论文,均基于国家健康与营养调查(NHANES)等公共数据集的研究。2024年10月前的统计显示,此类论文数量从2014-2021年的年均4篇飙升至2024年的190篇,增长近50倍。 Spick发现,收到的NHANES 论文都遵循相同的模式,选择健康问题(如抑郁症)、关联因素(如维生素D水平)和特定人群(如65岁以上男性),通过排列组合生成"新发现",好像每一种可能的组合都有人在研究。一些较新的 NHANES 研究,选择性地分析了其数据集的部分内容,却没有明确的理由,缺乏科学依据。例如,28项关于抑郁症的研究中,仅13项通过假阳性校正检验,显示超半数结论可能为统计噪声。 悉尼大学分子生物学家Jennifer Byrne指出,AI工具(如ChatGPT)被用于批量改写内容规避查重,这种操作难以溯源但具有明显组织性特征。 西北大学的元科学家Reese Richardson表示,这些免费数据源几乎允许任何人采用已知的研究方法,替换其中的变量,从而创造出新的“发现”,就像一种“研究填词游戏”。他表示,其他研究人员在多个主题中也发现了类似的“爆发”现象,包括遗传学研究、对不同科学学科中的文献计量或性别差异分析。 Richardson表示,这些论文反映了科学出版和研究奖励机制中的广泛问题,“文章中提到的所有出版商都接受了费用,可能每篇约为 1000 美元,以发表这些垃圾论文。” 当前的科学出版机制是研究人员被激励发表更多论文,而不是更高质量的论文。除非我们彻底重构科学出版的激励机制,否则问题“只会变得更糟”。

    发布时间: 2025-07-23

  • 37. 生成式人工智能专家笔谈
    于彰淇
    2023年5月,习近平总书记在主持召开中共中央政治局会议时提出,“要重视通用人工智能发展,营造创新生态,重视防范风险”,为推动生成式人工智能的发展指明了方向。为深入贯彻落实习近平总书记的重要指示精神和党中央决策部署,2023年7月,国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局公布了《生成式人工智能服务管理暂行办法》(以下简称《办法》)。《办法》明确提出了生成式人工智能服务与管理主要原则,“国家坚持发展和安全并重、促进创新和依法治理相结合的原则,采取有效措施鼓励生成式人工智能创新发展,对生成式人工智能服务实行包容审慎和分类分级监管”,并从基本概念、发展举措、服务方式、监督检查、法律责任等方面提出规范要求,为生成式人工智能的健康发展提供了重要保障,是我国在人工智能治理之路上迈出的关键一步。 本刊编辑部对《办法》的制定和出台一直保持密切关注。早在2023年4月,《生成式人工智能服务管理办法(征求意见稿)》发布不久之后,编辑部即邀请多位专家聚焦这一议题,持续跟踪《办法》与生成式人工智能的进展。与以往的笔谈相比,此次专栏的独特之处可以用八个字来概括:跳出边界、奔向未来。生成式人工智能的影响力无远弗届,已经开始深入人类社会的政治、经济、文化、伦理等方方面面,这些影响力亦在互相渗透,逐步编织起一个崭新的智能时代——《办法》第五条也提出,“鼓励生成式人工智能技术在各行业、各领域的创新应用,生成积极健康、向上向善的优质内容,探索优化应用场景,构建应用生态体系”。面对这种纵跨多行业和领域的新型技术,唯有“跳出边界”,以跨学科的宏阔视域、多领域的密切合作、全场景的实践方案,方能更好地应对其滔天翻浪式的影响和冲击;唯有以预见式的眼光、带入负责任创新的理念,汇聚多方面的思想资源和行动力量,方能奔向“积极健康、向上向善”的未来,有力地回应其带来的、复杂且复合的“技术-社会”议题!

    发布时间: 2023-12-01

  • 38. 图书馆版权联盟在评论美国人工智能行动计划时支持合理使用权
    王江宁
    在给白宫科技政策办公室(OSTP)的评论中,图书馆版权联盟(LCA)鼓励政府在国家“人工智能行动计划”中维护合理使用原则,防止许可限制损害这些权利。 合理使用是美国版权法的一个组成部分,为人工智能研究人员在未经版权所有者许可的情况下收集和训练内容提供了法律基础。这种竞争优势使美国处于全球人工智能创新的前沿。LCA建议政府在人工智能公平使用案例中提交法庭之友简报,辩称人工智能的公共利益大大超过对权利人的潜在影响。如果司法裁决限制生成式人工智能的发展,LCA建议政府要求国会制定立法来保护这一技术进步。 此外,LCA鼓励行政部门提交法律意见书,辩称在人工智能环境中合理使用允许的复制的合同禁止是不可执行的。如果法院不支持这一原则,政府应敦促国会制定立法,明确规定合理使用和其他版权法条款优先于相互矛盾的许可条款。 这些建议回应了网络和信息技术研究与发展(NITRD)国家协调办公室(NCO)、国家科学基金会(NSF)代表OSTP提出的信息请求。 ARL信息政策和联邦关系主管Katherine Klosek说:“美国研究型图书馆每年花费超过10亿美元为研究人员授权使用数字数据库和期刊。”“通过保护合理使用权,政府可以最大限度地提高对美国研究基础设施的大量投资的效率和效果。”

    发布时间: 2025-07-23

  • 39. 美国专利无效宣告请求倾向的关键影响因素研究
    程冰
    [目的/意义] 经济全球化、生产全球化的大背景下,提起专利无效宣告是阻挠竞争企业国际专利布局以及战略实施的常用手段。研究美国专利无效宣告请求倾向的关键影响因素,并分析其作用机理,旨在帮助我国企业更好地理解专利无效宣告请求的风险,进而采取相应的措施来降低专利的无效宣告请求的发生概率,保护其技术创新成果,增强在国际市场中的竞争力。[方法/过程] 以在美国发生专利无效诉讼的专利数据作为研究对象,从专利关联性、法律稳定性、技术价值性、市场价值性和产业领域5个维度,识别引起专利无效宣告请求的关键影响因素。在此基础上,通过构建结构方程,分析各因素之间的互动关系及其对专利无效宣告请求的作用机理。[结果/结论] 结果显示法律稳定性、市场价值性和产业领域会直接影响无效宣告请求的发生概率,而专利关联性和技术价值性与无效宣告请求的发生存在间接关系。

    发布时间: 2025-07-22

  • 40. 理解知识中介组织的影响:以英国“有效工作中心”为例
    程冰
    2025年5月28日,英国卡迪夫大学卡迪夫商学院的学者发表一项关于知识中介组织对政策与实践的影响研究。建立知识中介组织(KBOs),正日益成为应对研究与政策互动挑战的普遍做法,这些组织承担着关键的证据动员功能。但其对政策和实践的具体影响方式及程度仍未得到充分探讨。这种研究不足,主要源于难以在更广泛的网络中,将特定影响归因于中介行为者。因此,亟需深化对 KBOs 影响及其评估方法的理解。本文通过对英国“有效实践中心”WWCs)网络的定性研究,回应了这一需求。本文的研究问题是:(1)WWCs如何在不同背景下对政策或实践做出贡献?(2)WWCs 如何将其潜在贡献与其定义、跟踪和展示影响的方式相关联?本文通过展示英国“有效工作中心”(WWCs),不仅通过促进获取证据来影响政策和实践,还通过与决策者建立密切关系,以及在专业和地域系统内构建运用知识的能力,丰富了关于知识中介组织(KBOs)的文献研究。结果还强调,WWCs 正处于制定计划和评估这些影响的方法的过程中,这些方法反映了影响的复杂性和不确定性,最后,本文讨论了可能的评估框架,展示 KBOs 对影响发生过程所作贡献。

    发布时间: 2025-07-23

  • 41. AIGC在学术写作中的应用
    杨小芳
    人工智能生成内容(Artificial intelligence-generated content, AIGC)和 AIGC 模型已成为内容创作领域的强大工具。这些人工智能系统旨在以超乎想象的速度和规模生成文本,包括学术论文。虽然人工智能技术显示出了巨大的潜力,但它也引发了一系列问题,尤其是在学术写作方面。 在本文中,我们将定义 AIGC 及其模型,探讨其在学术界日益广泛的应用,及其引发的问题,并讨论期刊如何检测未披露的AIGC。此外,还会讨论未披露 AIGC 使用情况的后果,并强调学术出版中使用人工智能的透明度和道德的重要性。 1 AIGC的定义及其模型 AIGC 是指人工智能系统制作的书面、视觉或听觉材料,通常由先进的语言生成模型驱动。这些模型进过了大量数据集的训练,能够模仿人类语言,生成各种主题的内容。近年来,人工智能生成的内容已进入新闻、营销和学术等各个领域。 在学术领域,AIGC 模型被用来起草研究论文、摘要和期刊文章,这些人工智能系统能够生成近似人类写作的文本。 2 AIGC在学术写作中的常见问题 在学术写作中越来越多地使用人工智能引起了一些关注。这些问题包括: a. 作者身份和所有权:当人工智能系统生成内容时,就会产生作者归属的问题。是程序员、用户还是人工智能本身?内容归谁所有? b. 创造性:人工智能生成的内容往往缺乏人类作者为其作品带来的创造性火花和独特视角。这可能会导致学术写作中个人风格和研究视角的缺失。 c. 虚假参考文献和偏见:人工智能生成的论文可能会引用不存在的资料来源或提供有偏见的信息。这对研究的完整性构成重大风险。 3 期刊对使用AIGC的规定 大多数学术期刊对人工智能生成器的使用都有严格的规定。虽然这些期刊通常禁止将人工智能生成器列为作者,但它们要求全面披露其使用情况。例如,有些期刊要求使用人工智能技术的作者全面介绍所使用的工具、方法以及评估所生成数据可信度的手段。透明地使用人工智能被认为是保持研究完整性的关键。 如果作者没有在稿件中声明使用了人工智能生成工具,期刊会设立机制来识别未披露的AI工具。 4 期刊采用哪些方法检测AIGC? 1. 同行评审:审稿人可以利用他们的专业知识发现稿件中不寻常或可疑的写作风格。人工智能生成的内容可能表现出句子重复和结构不连贯等模式。查重检测软件也可用于分析文本与已知 AIGC 的宏观相似性。 2. AI文本识别工具(AI Text Classifiers):机器学习算法和自然语言处理技术用于分析大量研究文章,包括已知的 AIGC 生成的内容。这些算法经过训练,可以识别人工智能生成的文章所特有的独特模式,从而区分人类和人工智能撰写的内容。 3. 元数据分析(Metadata Analysis):对文章的作者、发表日期和发表期刊等进行检查。将这些信息与 AIGC 生成的内容进行比较,可以发现相似之处。 4. 查重检查:查重工具将稿件文本与现有文章进行比较。与已知 AIGC 的高度相似性可能表明使用了AI生成器。 5. 无监督机器学习:聚类算法把与 AIGC 生成内容相似的研究文章进行分组,帮助检测。 6. 人工审核:使用 AI生成工具可能性较高的文章可能会经过人工审核,确保AI检测工具的准确性。 5 未披露AIGC使用情况的后果 如果学术期刊发现稿件中使用了AIGC,但是论文中没有说明,可能会给作者带来不利后果。这种行为被认为是不道德的,会对作者的诚信造成不良影响。 1. 伦理影响:学术写作中未披露 AIGC 会引发严重的伦理问题。它破坏了诚实、透明和学术诚信的原则。 2. 损害作者声誉:这可能会造成长期的后果,因为诚信和信誉在学术界至关重要,学者和同事可能会对这类作者产生怀疑,他们今后的贡献也可能会受到质疑。 3. 期刊拒稿:如果在编辑审核或同行评审过程中发现未披露AIGC,期刊可能会直接拒稿。 4. 对期刊公信力的影响:读者和整个学术界都依赖期刊坚持严格的标准,这方面的任何疏忽都会对期刊的声誉造成不利影响。 5. 法律影响:在极端情况下,未披露AIGC 使用情况可能会导致法律后果。抄袭和学术不端行为会受到严肃处理,受此类行为影响的机构或个人可能会追究法律责任。

    发布时间: 2024-01-19

  • 42. 《北京市人工智能行业大模型创新应用白皮书(2023年)》发布
    杨小芳
             11月29日,北京市科学技术委员会、中关村科技园区管理委员会在AICC 2023人工智能计算大会上发布了《北京市人工智能行业大模型创新应用白皮书(2023年)》(以下简称《白皮书》)。    《白皮书》从大模型全球发展态势、国内外行业应用概述、北京应用情况和发展建议等方面进行了系统分析和阐述,旨在进一步推动大模型应用落地,展示北京市大模型应用成果,促进大模型价值传播和供需对接。    《白皮书》认为,大模型技术迅速迭代,打破了原有AI技术发展的上限,呈现出数据巨量化、模型通用化、应用模式中心化等特点,以“无限生产”的能力重塑企业生产引擎,推动生产效率颠覆式提升。从全球范围看,世界各地均在积极推动大模型研发和应用,其中美国和中国发布的通用大模型总数占全球发布量的80%,成为大模型技术领域的引领者;欧盟、英国、加拿大、新加坡等国家和地区尚处于前期尝试阶段,仅个别头部企业开始应用。从全国范围看,国家和地方层面高度重视通用大模型产业发展。2023年7月,国家网信办、国家发展和改革委员会、教育部、科学技术部、工业和信息化部、公安部、国家广播电视总局等7部委联合公布《生成式人工智能服务管理暂行办法》,鼓励和规范生成式人工智能创新发展;北京、上海、广东等多省市也陆续出台大模型产业发展措施,加速大模型应用落地。从北京市大模型产业发展来看,北京是当前国内人工智能领域创新基础最好、人才资源最集中、研发创新能力最强、产品迭代最活跃的地区,现已拥有大模型创新团队122家,数量居全国首位,约占全国的一半。    《白皮书》详细梳理了现阶段北京市大模型应用的典型特点。从模型演进看,通用大模型趋于收敛,垂直行业应用成为大模型产业落地的关键赛道;当前,大模型发展呈现出从技术到产品、再到商业化应用的发展路径,并不断深入垂直行业领域。从应用领域来看,大模型应用案例百花齐放,已经在传统产业赋能、金融、政务、文化旅游、医疗、智慧城市等各个领域得到初步应用,其中,传统产业赋能和金融领域发展较快,如传统产业赋能领域有产业知识问答、图文生成等,金融领域有智能投研助理、智能客服等。从应用类型来看,大模型主要有内容生成、智能问答、IT支持、数据分析、智能识别和智能硬件等六个方面,其中内容生成和智能问答最为成熟。从商业模式来看,目前大模型商业模式初具雏形,形成了以通用大模型AI服务为主的基础层、以垂直行业领域AI服务为主的行业层和以大模型应用服务为主的应用层,三层服务相互促进,协同优化,共同支撑产业转化和发展。    《白皮书》对北京市大模型应用案例进行了梳理,从政务、金融、医疗、传统产业赋能、文化旅游、智慧城市等六个行业领域切入,围绕创新性、示范性、经济与社会效益性、可推广性等四个维度,选取衔远科技、360、瑞莱智慧、旷视、百度等18个典型案例,详细分析了各领域用户需求、解决方案、项目成果。如衔远科技围绕北京一轻科技集团在市场需求跟踪、新型产品研发等方面需求,打造品商大模型示范应用,形成商品智能反向定制、预测性生产、智能调度、智能营销等服务功能,加速消费制造领域全链路数智化升级;360围绕银行在数字化转型方面需求,打造金融领域大模型,实现员工平均办公文档处理时间减少40%等。基于案例分析,《白皮书》进一步提出了目前大模型应用落地面临的挑战。一是算力资源供不应求,成为大模型企业创新研发的重要挑战。二是高质量数据成为严重掣肘大模型行业应用的关键。三是大模型幻觉问题有所改善,但离规模落地尚有差距。四是大模型应用存在“蹭热度”和同质化情况。 附件:北京市人工智能行业大模型创新应用白皮书(2023年)

    发布时间: 2023-12-01

  • 43. 2025年人工智能十大趋势
    程冰
    美国《福布斯》杂志于9月24日刊登题为《人人都必须为2025年的十大人工智能趋势做好准备》的文章,作者为未来学家伯纳德·马尔。文章深入剖析了2025年人工智能(AI)的十大趋势,这些趋势不仅预示着技术的不断进步,也反映了人类社会在面对科技变革时的适应与挑战。 今年,几乎所有主要的软件工具都在匆忙整合生成式人工智能功能。谁都不愿意错过这次上船的机会。2025年,我预计,人类将更多地考虑如何与人工智能携手合作,扩展我们的技术能力,同时腾出时间把我们的创造性和人际交往技能应用到机,器仍然无法管理的工作中这不是简单地把聊天机器人添加到所有领域,而是未来一年智能企业开始利用人工智能创造真正价值的方式。 趋势二:实时自动决策 随着企业开始从战略上应对利用人工智能的挑战,那些拥有更加成熟的人工智能战略的企业将走向整个业务流程的端对端自动化。这很可能发生在物流、客户支持和营销领域,算法将在这些领域进行决策,比如如何管理库存和如何以最小的人为干预回应客户问询。这将带来更高的效率和对变化中的客户习惯与市场状况更快的反应速度。 趋势三:“负责任”的人工智能 在2025年,人们将日益意识到以一种合平伦理、安全、透明、可靠和尊重知识产权的方式开发和部署人工智能的重要性。虽然这其中有部分将由立法推动,但人们也越来越意识到不负责任地使用人工智能可能造成的危害。许多人现在意识到人工智能偏见和幻觉的危险,并明白要将这种危险降到最低需要人类协同一致的努力。选择无视这一点或走捷径的企业在2025年可能会被曝光、遭遇监管机构的压力和顾客的抛弃。 趋势四:文生视频与新一代语音助手 想象一下:你可以仅仅写出一部电影的主要情节,或是一段视频的一个小片段,然后,整个视频就会在你眼前真实播放出来。想想ChatGPT(聊天生成预训练转换器),只不过生成的是活动的图像。OpenAI公司今年利用其Sora(“天空”)模型展示了这一概念,2025年它可能会开始投入使用。虽然我不认为人们马上能根据提示创作出让迪士尼公司失去收入的电影,但这是令人着迷的一瞥,可以让人看到,在不久的将来人工智能将走向何方,以及它可能具备的能力。 趋势五:人工智能立法和监管更加完善 人工智能语音助手(想想Siri或Alexa)多年来已经成为我们生活中的一部分,但传统上他们的对话能力非常有限。今年,OpenAl为ChatGPT展示了一种新的“可中断"的先进语音模式,能够进行与人类对话高度类似的对话。而谷歌已经开始将Gemini (“双子座”"人工智能模型)聊天机器人整合到移动设备中,取代现在已经过时的"Hey Google"功能。我认为,2025年,我们将看到这些能力出现在越来越多的设备中,使之能够进行更自然、更有意义的语音沟通。 趋势六:人工智能体或将流行 可以公正地认为,迄今为止,各国政府和立法人员一直在努力应对监管人工智能的挑战。今年,欧盟和中国通过了旨在限制人工智能造成伤害可能性的法律。措施包括将“深度伪造”定为犯罪,对金融、执法等领域应用人工智能进行规范等。2025年,我们可以预期更多规定出台,重点是优先考虑人权,将发生歧视和虚假信息的可能性降至最低。 趋势七:“后真相”世界 我们今天看到的大多数人工智能工县都是以执行简单任务为基础,比生成文本或解读数据以作出预测,人工智能体是能够在没有得到精确指令的情况下运作的工县,它们会把无数任务串在一起,并根据所取得的结果调整自己的行为。这可以被视为实现“通用"人工智能的重要一步,它能够完成许多不同类型的任务。然而,这也让人们更加质疑人工智能监管和问责的必要性。 趋势八:人工智能+网络安全 2025年,整个社会将面临人工智能带来的假内容和假消息爆发式增长的重大挑战。今年在全球范围内已发生干预选举的尝试。有人说,这意味着我们已经到了一个“后真相"时代,我们不再能够相信自己的眼睛看到的一切。2025年,我预计社会将开始应对这一挑战。这一改变将由各国政府通过立法推动,同时也将在民间通过教育和让人们学会更小心地辨别呈现给他们的信息来推动。在2025年,网络攻击将继续变得越来越频繁和复杂。这意味着,人工智能系统在网络安全威胁造成严重破坏之前发现潜在漏洞、异常情况,以及让网络安全系统自动化等方面将变得更加重要。不过,这并不全是关于看不见的、位于幕后的算法。随着越来越多的威胁以网络钓鱼和社会工程攻击的形式出现,聊天机器人能通过模拟网络钓鱼教会我们如何发现威胁和避免成为受害者。 趋势九:量子人工智能 量子计算虽然仍处于起步阶段,但它可能给人工智能带来革命性变化。量子计算利用亚原子水平上的材料表现出的奇特性,以前所未有的速度执行某些计算任务。让算法能够以亿倍于标准计算机的速度运行,不仅仅会让人工智能变得更快,它还可能完成全新的任务,在从疫苗和医药研发到新材料和新能源的生产等领域开辟新的可能性。预计在2025年,这种令人惊叹的潜力给人们带来的兴奋将开始增长。 趋势十:“可持续”的人工智能 可持续人工智能包含两个因素。首先,人们越来越清楚地认识到,基于云的人工智能系统需要耗费巨大能源,我认为,我们将在数据中心看到大家齐心协力地转向可持续和可再生能源。其次,旨在提高可持续性、减少其他行业的环境足迹的人工智能应用潜力巨大。利用算法尽量减少农业用水和杀虫剂的使用,到在城市更有效地引导交通出行,以减少汽车排放造成的污染,2025年人工智能将继续让自己成为环境保护的有力工具。

    发布时间: 2024-10-31

  • 44. OpenAI与美国国家实验室合作,扩大GPT-4o应用范围
    程冰
    7月11日,OpenAI在官网宣布与美国顶尖的国家实验室之一洛斯阿拉莫斯进行技术合作,研究如何安全地在实验室环境中使用GPT-4o等多模态模型,加速生物科学研究。 最近,美国白宫发布了一项关于安全、可靠、值得信赖的AI发展和使用的行政命令,要求美国能源部的国家实验室帮助评估前沿AI模型的能力,包括生物学能力。 这对OpenAI来说很重要,因为它们相信AI有潜力加速科学的发展,为人类带来好处。例如,Moderna公司正在利用OpenAI的技术来辅助临床试验开发,构建了一个数据分析助手,帮助分析大量数据。 ColorHealth通过GPT-4o建立了一个新的辅助工具,帮助医疗提供者做出基于证据的癌症筛查和治疗决策。 OpenAI和洛斯阿拉莫斯国家实验室的生物科学部门正在进行一项评估研究,像GPT-4o这样的多模态模型,如何通过视觉和声音等能力帮助人类在物理实验室环境中执行各种任务。 例如,对湿法实验室设置不太熟悉的研究人员可以简单地向GPT-4o展示他们的设置,并提出问题,并通过相机直观地排除故障以简化整个实验流程;或者将外来遗传物质引入宿主生物体,细胞培养等。

    发布时间: 2024-07-26

  • 45. 佳文速递|ChatGPT中文性能测评与风险应对
    黄雨馨
    ChatGPT中文性能测评与风险应对 【目的】 介绍ChatGPT的主要技术创新,使用9个数据集在4个任务上测评ChatGPT的中文性能,分析ChatGPT潜在的风险以及中国应对策略建议。【方法】 使用ChnSentiCorp数据集测试ChatGPT和WeLM模型,EPRSTMT数据集测试ChatGPT和ERNIE 3.0 Titan,发现ChatGPT在情感分析任务上与国产大模型差距不大;使用LCSTS和TTNews数据集测试ChatGPT和WeLM模型,ChatGPT均优于WeLM;使用CMRC2018和DRCD数据集进行抽取式的机器阅读理解,C3数据集进行常识性的机器阅读理解,发现ERNIE 3.0 Titan在该任务中优于ChatGPT;使用WebQA和CKBQA数据集进行中文闭卷问答测试,发现ChatGPT容易产生事实性错误,与国产模型差距较大。【结果】 ChatGPT在自然语言处理的经典任务上表现较好,在情感分析上具有85%以上的准确率,在闭卷问答上出现事实性错误的概率较高。【局限】 将判别式的任务转为生成式的过程中可能引入评估分数的误差。本文仅在零样本情况下评估ChatGPT,并不清楚其在其他情况下的表现。由于后续版本的迭代更新,ChatGPT评测结果具有一定的时效性。【结论】 ChatGPT很强大但仍然存在一些缺点,研发中国化的大模型应以国家战略需求为导向,并且注意语言模型的风险和局限。

    发布时间: 2023-10-10

  • 46. SPARC 欧洲开放教育战略 2024-2026
    徐宏帅
    SPARC 欧洲开放教育战略 2024-2026 2024年1月24日,欧洲学术出版与学术资源联盟(SPARC Europe)和欧洲开放教育图书馆员网络(European Network of Open Education Librarians)联合发表文章——《开放教育战略:2024-2026》。该战略旨在通过有针对性和以行动为导向的方法实施教科文组织开放教育资源建议书。 愿景 在推动开放获取和开放科学议程方面,欧洲高等教育中的图书馆是实现开放教育的关键、积极和值得信赖的合作伙伴。它们通过使教育资源、服务和实践可访问、开放和可重复使用,帮助实现开放教育的标准化。 “我们的使命是支持欧洲高等教育政策制定者、图书馆员、开放教育大使和促进者,通过有针对性和以行动为导向的方法,帮助实施教科文组织开放教育资源建议书。我们努力促进开放获取和开放科学发展,最大限度地为所有人提供开放教育资源、实践、服务和基础设施的获取、创建、重用和改编。同时,我们尊重并支持多样,公平和包容(Diversity, Equity and Inclusion 缩写DEI),以反映和满足当地的需求。” 关键目标 支持开放教育政策的发展,鼓励欧洲学术界对开放教育投资促进其可持续发展 倡导开放议程,明确将开放科学政策与高等院校开放教育联系起来; 向机构政策者宣传开放教育的价值; 为欧洲各地的开放教育相关政策制定提供指导; 倡导投资于开放教育人员、服务和基础设施发展以及其他。 提高对开放教育, 开放教育资源和实践价值的认识,并鼓励采取行动,比如将开放教材作为教学工具等 提高教育工作者、图书馆员和学生对开放教育、开放教育资源和开放教育实践好处的认识; 激励和促进各机构在地方、地区和国际上展示其实践案例,鼓励他们与各利益相关方进行互动; 更好地了解开放教育教科书,并将其推广为开放教育和实践的有效工具,使其与商业教科书相媲美。 倡导对开放教育人员、实践的认可和奖励 将对开放教育工作的认可和奖励需求引入决策层讨论; 展示欧洲及其他地区开放教育获得奖励的优秀案例。 加强图书馆员的能力建设,提高图书馆员的技能,使其更有效地支持教职工和学生开展开放教育 提供工具和资源,以帮助开放教育图书馆员提高相关能力,有效应对数字转型发展; 通过互动,展示欧洲各机构的优秀案例以及他们用于支持活动的开放工具,在互动活动中辅导和培训图书馆员进行开放教育实践。 在欧洲各地促进富有DEI色彩的开放教育计划 提供培训和资源,指导如何创建多样、公平和包容(DEI)的敏感材料,以便服务广布各社区的少数特殊群体。

    发布时间: 2024-04-29

  • 47. 人工智能素养:一种提议的层面分类法
    程冰
    摘要: [目的]提出一种人工智能(AI)素养的分类法,以支持AI素养教育和研究。 [设计/方法论/方法]本研究采用了层面分析技术,并面回顾,检查知名的AI分类方案和分类法,回顾以往关于数据/信息/数字素养研究的文献,以及对1,031条关于AI素养出版物的元数据记录进行定性和定量分析,使用KH Coder 3软件应用程序分析来自Scopus多学科数据库的元数据记录。[发现]提出了一个新的AI素养分类法,包含13个高级层面以及每个层面的具体主题列表。 关键词:人工智能素养,AI素养,分类法,AI素养分类法,AI素养概念化,人工智能  Shiri, A. (2024), "Artificial intelligence literacy: a proposed faceted taxonomy", Digital Library Perspectives, Vol. 40 No. 4, pp. 681-699. https://doi.org/10.1108/DLP-04-2024-0067

    发布时间: 2025-07-23

  • 48. 数字生态下数据向善的源起、要素、驱动与困境
    黄雨馨
    数字生态下数据向善的源起、要素、驱动与困境 储节旺 / 李佳轩 图书情报工作.2023 Vol.67 (10): 3-14. 摘要: [目的/意义] 探析数据向善的本质内涵与边界,对其实现的驱动因素进行挖掘,以帮助我国数字生态实现常态化数据向善发展。[方法/过程] 通过理论溯源探求数据向善的内在要素与范畴,界定其本质概念,之后使用ISM模型分析数据主体采取数据向善行为的驱动因素,最后剖析数据向善实现的困境与未来。[结果/结论] 研究发现驱动数据主体采取数据向善的动因可以分为核心动因、间接动因与表层动因,选择合适的驱动因素是实现数据向善的关键。在未来如果想要在社会层面上普及数据向善,需要从行规、法律、市场环境等多个维度出发。

    发布时间: 2023-10-10

  • 49. Clarivate 推出基于订阅的访问策略
    程冰
    科睿唯安推出了一项基于订阅的内容访问策略,逐步淘汰图书馆的一次性永久购买模式,以实现更广泛且经济实惠的学术资源获取,支持研究和教学。新产品包括ProQuest电子书和ProQuest数字馆藏,涵盖多个学科和丰富的学术资源。同时,公司明确了与图书馆和出版商紧密合作的承诺,以满足不断变化的社区需求。

    发布时间: 2025-07-23

  • 50. 数字化转型视域下的数据价值研究综述:内涵阐述、作用机制、场景应用与数据创新
    黄雨馨
    数字化转型视域下的数据价值研究综述:内涵阐述、作用机制、场景应用与数据创新 马捷 / 郝志远 / 李丽华 / 张羽 图书情报工作.2023 Vol.67 (15): 4-13. 摘要: [目的/意义] “数据价值”作为数字化转型视域下一种不断深化的概念,当前与之直接相关的研究尚处探索阶段。对既有研究进行解构梳理、认知辨识,有利于开掘激发数据潜力、释放数据活力的全新数字化范式。[方法/过程] 在数字化转型背景下探索数据价值的概念内涵,并结合数字化转型的现实特征以及既有研究所呈现出的热点态势,明晰数据价值的作用机制,厘清数据价值在不同外化场景中的应用表现,同时洞悉数据价值驱动下的数据创新行为,最终剖析出当前数据价值研究存在的局限与桎梏。[结果/结论] 当前关于数字化转型视域下的数据价值研究总体呈现出分散化、模块化的态势特征,相关研究的聚焦性不强、侧重性不明显。未来还需要在数据成为生产要素的价值特征、数据价值“形成、释放、实现”的理论逻辑以及科学设计数据价值驱动的数据创新路径与实现模式等方面深入探索。

    发布时间: 2023-10-10

  • 51. 高等教育研究中的数字能力:系统文献综述
    饶海侠
    在信息知识社会,科技快速发展并深入渗透到我们的生活中,关于数字能力的讨论已成为当今的热门话题。冠状病毒(Covid-19)出现及其对教育行业产生巨大影响后,学者对数字能力的关注达到了新的高度。 2021年4月8日,学者Y. Zhao等人在《Computers & Education》期刊上发表《Digital competence in higher education research: A systematic literature review》一文。该文献综述使用 Web of science 和 Scopus 作为数据库来存储和分析高等教育环境中数字能力的现有研究。该综述的目的是为学术界提供2015年至2021年高等教育背景下数字能力研究的最新概况,包括数字能力的定义、评估数字能力的维度、研究目的、方法和结果和限制。主要调查结果包括,大多数出版物在描述数字能力的定义时引用了研究和欧盟政策。审查表明,大多数大学生和教师具有基本的数字能力水平。 此外,鼓励高等教育机构注重学生和教师数字能力的发展,制定相关学习策略并使用适当的工具来提高教育质量。 研究内容 本篇文章是一篇关于高等教育中数字能力的系统文献综述。研究通过对33篇相关研究的分析,回答了四个研究问题:1)高等教育中数字能力的定义是什么?2)常用的评估高校教师和学生数字能力的维度有哪些?3)过去七年来,在高等教育领域中关于数字能力的研究目的、方法和结果有哪些?4)高等教育中数字能力研究存在哪些限制??为了回答这些问题,研究采用了系统综述的方法,选择了Web of Science和Scopus两个电子数据库进行文献检索。通过应用特定的搜索字符串,筛选出符合研究目的和标准的文章。研究结果显示,数字能力的定义涵盖了信息、沟通、数字内容创作、安全和问题解决等多个维度。在评估高校教师和学生的数字能力时,常用的维度包括ICT工具的使用和知识、互联网和ICT相关能力、数字相关经验和对数字技术的态度等。过去七年来的研究主要集中在调查和评估参与者对数字能力的认知和水平、探究影响数字能力的因素、评估数字能力对学生成就的影响以及研究数字能力相关工具的验证等方面。文章最后指出了研究的限制,并提出了未来在高等教育中数字能力发展方面的研究建议。 研究结论 1. 高等教育中数字能力的研究主要关注教师和学生的数字能力水平和认知。研究多角度评估了学生的数字能力认知,包括一般认知水平和特定类型的认知。同时,研究还探讨了影响数字能力的因素,以及数字能力对学生学业成就的影响。 2. 在研究方法方面,研究采用了多种研究方法,其中最常见的是定量研究方法,通过问卷调查收集数据。部分研究还应用了偏最小二乘结构方程模型(PLS-SEM)来探究数字能力对数字非正式学习的影响。 未来方向: 首先,大多数入选文章探讨了数字能力的认知和水平。然而,他们中的大多数人通过自我报告的数据来评估它,这些数据可能无法显示他们的数字能力的真实水平。对数字任务进行实际测试可以更好地了解参与者的数字能力。此外,亚数字能力领域不容忽视,值得更详细地研究。 其次,本系统综述的结果表明,在总共33项研究中,涉及数字能力的教学法和数字能力相关工具的验证仅占6%。需要进一步探讨如何利用和沉浸数字能力进行教学,以及如何建立和验证与数字能力相关的工具。 第三,根据本次系统文献综述的结果,许多文章只使用了一种研究方法。定量数据方法与定性数据方法相结合,可以提供有关高等教育数字能力的更全面的结果。 最后,本系统综述的结果表明,本科生是数字能力研究中研究的常见群体,尤其是一年级学生。尽管本科生在高等教育学生中所占比例最大,但对研究生和教师进行更深入的与数字能力相关的研究是相关的。未来的研究人员应该注意样本量,因为这些可能会影响结果是否具有代表性。

    发布时间: 2024-10-31

  • 52. 分析学术图书馆网站上可用和可访问的内容、服务和资源
    程冰
    摘要:[目的]本研究旨在审查学术图书馆网站的内容,特别关注通用信息、服务、信息资源、功能特性、支持用户教学、学习和研究的教学工具,以及网站导航工具的可见性和活跃度。[设计/方法/途径]本研究关注六类高等院校:公立大学、理工大学、特许私立大学、大学学院、教育学院以及护理和助产学校。研究人员从每一类中特意选择了五所拥有图书馆网站的不同院校。本研究回顾分析了30个图书馆网站。[结果]结果显示,网站上的内容和信息普遍较低,具体体现在信息资源和馆藏的可用性、通过网站提供的服务类型、网站的功能和特性、支持教学、学习和研究的教学工具,以及网站上导航工具的可见性或活跃度。尽管如此,公立大学在其图书馆网站上展示的信息、服务、信息资源、教学工具和导航工具的数量普遍高于平均水平,其次是技术大学、特许私立大学和大学学院。相反,教育学院和护理及助产学校在提供与电子资源、教学工具和导航工具相关的信息方面在很大程度上存在不足。 关键字:图书馆,网站,大学,信息资源,服务,导航工具,导航链接 Dei, D.-G.J. (2024), "Analysis of content, services, and resources available and accessible on websites of academic libraries", Digital Library Perspectives, Vol. ahead-of-print No. ahead-of-print. https://doi.org/10.1108/DLP-02-2024-0027

    发布时间: 2025-07-23

  • 53. 字节推出首个复杂材料的大规模量子模拟算法,成果入选 npj Computational Materials
    黄雨馨
    量子计算作为新的计算范式,已经展现了在量子化学领域中的潜在巨大价值,为药物发现、材料设计和催化剂优化等领域提供了广阔的前景。 目前在简单分子的量子模拟方面已经取得了令人振奋的进展,但在量子计算机上进行固体材料的模拟仍然困难重重。这是因为不同于孤立的分子,要想准确计算材料的性质,需要将系统的规模推广至热力学极限。这会使得问题规模随采样 K 点迅速增大,模拟所需的量子资源爆炸式增长。 譬如,针对一个典型的复杂体系过渡金属氧化物-氧化镍(NiO),尽管该体系在材料模拟计算中属于中小规模的问题,仍然需要大约 10000 量子比特,这将远超当前量子计算机可以处理的范畴。根据目前业界最新的报道,目前在真实量子计算机上的化学模拟最大规模却不超过 20 量子比特。 针对当前含噪中等规模量子器件,由于系统的有限相干时间、量子门的保真度等一系列因素,极大限制了当前量子计算机能实际处理问题的规模。为应对这一挑战,字节跳动 ByteDance Research 团队创造性地结合了量子嵌入理论和量子计算,极大地扩大了当前量子处理的问题规模。团队首先在分子体系上,进行了系统性测试,值得一提的是,团队用 16 量子比特模拟了 144  比特系统 C18 分子(ccpvdz 基组),并准确预测了相关体系的稳定结构,符合实验预期,相关结果已经发布在国际顶级期刊《Chemical Science》[1]。 从分子过渡到材料,并进一步围绕材料体系中存在的强关联系统进行的深入研究是一个自然的延伸,也是目前凝聚态领域等研究的热点和难点。同时,研究相关典型的强关联系统,有望进一步帮助我们理解更复杂的体系,如催化机理,超导机理等相关课题的研究,构建理解微观机制到宏观奇特量子现象的桥梁。因此当前或者中长期的量子器件上实现对固体材料的量子模拟,是一个十分必要的课题。 近期,字节跳动 ByteDance Research 团队联合清华大学胡憾石课题组,北京大学袁骁课题组和牛津大学孙金钊博士在最新工作《Ab initio quantum simulation of strongly correlated materials with quantum embedding》[2]中为这一问题提供了一种潜在的解决方案。 在这一工作中,受到上述《Chemical Science》工作的启发,以及 Garnet Chan 组近期发表在《Science》上的工作,提出的多层划分方法[3],作者在周期性密度矩阵嵌入理论中,引入了一种更精细的基于轨道的多片段划分方法,有效地缩减了当前的问题规模,以适应近期量子计算机的能力范围。通过在具有复杂电子结构的固态系统上进行实验,该方法展示了比传统方法更出色的准确性和效率。其中,作者重点研究了 1 维氢链的自旋极化态(1D-H)、2 维硼氮化物层的状态方程(h-BN)以及 3 维典型强关联过渡金属镍氧化物(NiO)中的磁序。相关研究成果于 2023 年发表于国际知名期刊《npj Computational Materials》。 论文链接:https://www.nature.com/articles/s41524-023-01045-0数值实验结果针对材料体系的研究,尽管整个问题的规模非常大,但其中最复杂或者我们最感兴趣的往往仅仅是系统的小部分,系统的剩余部分可以用便宜的方法进行准确的模拟,只有一部分需要用昂贵且精确的方法来处理,这就是量子嵌入理论的精髓。通过对系统进行多尺度求解,我们可以在求解规模和精度上达到一个平衡。具体而言,作者采用了多尺度的量子-经典混合算法,抽取出体系中作者关心的部分,利用量子计算机来处理,而剩下的部分,仍然交由经典计算机进行求解。其大体的流程如下图所示: 图 1:基于周期性密度矩阵嵌入理论的量子-经典混合算法流程图。作者通过对三个不同系统的模拟:1 维的氢链(1D-H)、2 维的六角硼氮层(h-BN)和 3 维的强相关过渡金属氧化物氧化镍(NiO),并与实验或其他精确的量子化学方法做了比较,以验证算法的可靠性和准确性。 在 1 维的氢链研究中,作者采用整个原胞当作片段(即图 1 中的 a 或 b),重点展示了非限制的幺正耦合簇拟设态 (Unrestricted Unitary Coupled-Cluster Ansatz) 的能力。在 2 维的六角硼氮层 (h-BN) 研究中,作者将单个原胞进行多片段划分,并得到和理论符合预期的结果,验证了在轨道尺度进行多片段划分的有效性。在 3 维的强相关过渡金属氧化物氧化镍 (NiO) 中,作者采用了在轨道尺度进行多片段划分方法和非限制的幺正耦合簇拟设态来系统地研究 NiO 的磁序,并得到合理的能量间隙。其中,为了模拟 NiO 的 AFII 和 FM 态,作者采用了每个单胞包含 2 个化学式单位的斜方晶体结构。Ni 原子简并的 3d 轨道会在 NiO 固体中的正六面体晶体场的作用下劈裂为半充满的和全充满的  两组轨道,进而作者将 NiO 单胞划分为三个片段,前两个片段分别包含一个Ni原子的 轨道和邻接 O 原子的 2p 轨道,并用量子计算机来处理这两部分;剩下的所有轨道都放入第三个片段,用经典计算机来处理。图 2:(a)NiO 的晶体结构。(b)计算中用到的 NiO 斜方晶体结构,以及片段划分示意图。此外,为了评估算法在真实量子硬件上的效果,作者还评估了噪音对计算结果的影响。总之,数值模拟结果表明,基于周期性密度矩阵嵌入理论的量子-经典混合算法,不仅可以计算准确可靠的材料性质,还能有效地减少量子资源的需求,尤其是对于氧化镍材料 (NiO),混合算法使量子资源需求从多达 9984 量子比特降至仅为 20 个,使得有可能在近期量子硬件上进行实验模拟。具体量子比特数,如下: 表1:文中所研究的每个系统的量子模拟所需要比特数。这些结果表明,现在可以使用量子计算机结合量子嵌入理论,对实际的固体材料相关性质进行定量预测。这项工作也为近期量子设备上的大规模和复杂周期系统的从头模拟研究铺平了道路。参考文献:[1] Li, W. et al. Toward practical quantum embedding simulation of realistic chemical systems on near-term quantum computers. Chem. Sci. 13, 8953–8962 (2022).[2] Cao, C. et al. Ab initio quantum simulation of strongly correlated materials with quantum embedding. npj Comput Mater 9, 1–11 (2023).[3] Cui, Z.-H., Zhai, H., Zhang, X. & Chan, G. K.-L. Systematic electronic structure in the cuprate parent state from quantum many-body simulations. Science 377, 1192–1198 (2022).

    发布时间: 2023-07-11

  • 54. 2024年人工智能人才现状分析
    程冰
    2024年2月,英国数据公司Zeki聚焦人工智能生态系统中的人才情况,发布了《2024年人工智能人才现状》(The State of AI Talent 2024)的报告,该报告基于过去10年的人工智能人才数据,结合机器学习和强化学习等技术,描绘了14万人工智能顶尖人才的研究成果和职业路径,揭示了一流人工智能科学家和工程师等人才在全球范围内的流动趋势及其背后原因。 一、全球人工智能人才现状 随着全球企业布局人工智能相关业务,对顶尖人才需求大增。美国五大科技公司虽因人工智能发展迅速,但在人才聘用上面临激烈国际竞争,全球其他大型科技公司雇佣的顶尖人工智能人才数量更多。这些人才跨境流动性高、频繁换职且注重自身价值实现,推动人工智能应用市场化及提升可信度。美国在全球人才市场主导地位渐失,欧洲医疗等行业吸引顶尖人工智能人才数量大幅增加,其他受监管行业也在培养相关人才。能吸引并留住人才的公司将扩大领先优势,加强知识产权保护和内部培训。 二、全球人工智能人才趋势 1. 人才市场两级化:自2015年起,美国大型科技公司引发顶尖人工智能人才争夺潮,形成人才引进国和输出国两级市场,人才流失国家面临技术落后风险。 2. 美国五大科技公司人才流动率高:其曾是人才职业发展快速通道,但高流动率和大规模招聘模式因市场份额下降和成本上升面临挑战。 3. 中型人工智能公司难生存:大型公司主导市场,收购有潜力初创公司,中型公司要么发展壮大要么被收购。 4. 人工智能推动产业转型:汽车、医疗等行业在人工智能驱动下重塑产业生态,医疗行业吸引人才能力指数增长,部分行业则未能吸引顶尖人才。 5. 部分国家人才流失或吸引人才:英国、德国等国吸引人才,印度、西班牙等国人才流失,亚洲和东南亚国家与美国进行人才交换。 三、研究发现 1. 人才竞争的赢家和输家:美国大型科技公司扩张引发人才需求激增,造成全球人才市场失衡,欧洲发达经济体形成两级系统。各国政府意识到风险,部分国家已开始扭转人才净流失局面,人才流向受国家人工智能生态系统影响。 2. 五大科技巨头招聘模式遇挑战:其招聘模式面临竞争加剧导致成本上升压力,因需支持更强计算能力,该模式或难持续。 3. 市场向纵深化和多样化发展:人工智能生态系统将更多样化,大型企业市场份额增长,中型研究组织吸引学术人才但人才流入工业界少,小型公司招聘人才多且具多样性。 4. 人才快速增长的行业:医疗、汽车等行业采用人工智能速度快,欧洲公司在医疗和国防领域招聘人才领先,部分小公司也成功吸引顶尖人才,咨询公司也在加速招聘。 5. 各国人才生态系统调整:人才流失影响国家安全发展,英国和德国扭转局面,法国等国落后,美国科技巨头从印度和以色列大学招聘导致人才流入美国,以色列能留住部分人才,印度则表现不佳。

    发布时间: 2024-11-22

  • 55. “京城飘书香 五洲共阅读” 第21届北京国际图书节开幕
    程冰
    6月15日,第21届北京国际图书节开幕式在国家会议中心举行。本届活动以“京城飘书香 五洲共阅读”为主题,将持续至18日,设置展示区、展销区和活动区3个功能分区、10个主题分区。 开幕式上,“走出去”项目《潮北京》多语种版出版,由北京广播电视台、北京出版集团、外文出版社现场举行签约仪式。故宫博物院原院长郑欣淼和英国知名汉学家、历史学家吴芳思进行了好书推荐。 记者在图书节现场看到,中华优秀传统文化展区精心策划了“玉楮流芳——中国古代书籍装潢艺术展”“光影中的古都之美——北京老照片展”“北京历史文献展”“中华优秀传统文化出版物展”以及“国家级非物质文化遗产古籍修复技艺展示及体验”5大专展。展区内,高3.7米、长15米高清显示屏循环播放栩栩如生的《万寿盛典图》及图解、《北京中轴线》影像,向广大读者呈现了一场集视觉、听觉和感观为一体的优秀传统文化盛宴。 “玉楮流芳——中国古代书籍装潢艺术展”上,中国书店充分发挥古旧书特色优势,细致甄选出近20种不同年代、装帧形制的古籍文献,隋写本《大般涅槃经》、北宋开宝八年吴越王钱俶刻本《一切如来心秘密全身舍利宝箧印陀罗尼经》、南宋刻本《欧阳文忠公集》、元福州路刻本《礼书》等格外引人注目。中国书店古籍修复技艺第四代传承人徐晓静现场展示修复技艺,她用一把镊子修复虫蛀的明代古籍,引来观众连连称赞。据介绍,观众既可以“零距离”观摩,也可在传承人的指导下“亲手做”,沉浸式体验古籍修复技艺。 值得一提的是,本届图书节的主会场开辟50%的区域作为出版物展销区,汇集400余家中外出版机构,集中展示展销10万余种优质出版物。读者不仅可以参与好玩有趣涨知识的活动,更能享受部分书籍打折优惠。图书节上的哈利·波特快闪店一露面,就吸引了众多哈迷前来打卡。中国图书进出口总公司工作人员赵圆告诉记者,快闪书店销售100多种哈利·波特周边图书,连哈利·波特小时候读的童话书都在其中。 接下来,观众熟悉的名家大讲堂也依然会延续,本届北京国际图书节特别邀请王蒙、李忠杰等名家,围绕文化自信自强,为读者带来10场高品质、宽视野的文化盛宴。观众除参与线下分享外,还有机会在现场获取名家签名,无法到达现场的观众,也可以通过新媒体平台同步收看线上直播。 据介绍,“书店之夜”活动作为图书节分会场,于6月16日到18日(每天16:30至20:30),在前门书香世业、PAGEONE书店(北京坊店)开展。活动汇集88家实体书店,全市将举办140余场活动(现场将举办60场活动),推荐上千种优质图书。活动现场还将宣布“最美书店、最佳店长(主理人)”评选结果及颁奖;召开“北京市实体书店高质量发展对话”,就北京市实体书店的创新发展之路交流互鉴。

    发布时间: 2023-07-11

  • 56. 国际图联发布Trend Report 2024: Survey Results
    杨小芳
    国际图联在2024年8月启动了一项调查,以收集对各种发展趋势的影响及其之间联系的观点。调查结果于当地时间2024年9月4日公布。 《国际图联趋势报告》的核心任务是支持图书馆、信息工作者及相关协会以知情、有准备、有自信的姿态来迎接未来。报告的重点是评估知识和信息环境的演变,展望未来可能出现的情况,并探索图书馆如何在实践中为变革贡献力量。报告并非要定义一个具体的愿景,而是设想可能出现的不同前景,以及如何适应它们。因此,2024年的《国际图联趋势报告》将围绕一系列设想情景展开,探讨这些趋势可能产生的积极或消极影响,特别是它们可能产生的相互作用。 调查结果分析表明,随着技能需求的日益增长以及人们对数字平等问题的日益关注,对图书馆的需求也将随之增长。尽管少有观点认为环境趋势会对图书馆或社会产生积极影响,但受访者确实认为这些趋势增加了对图书馆服务的需求。 本报告分享了国际图联对《2024 年趋势报告》文献综述中确定的趋势的调查结果。它重点介绍了不同趋势对社会、图书馆和图书馆服务需求的影响,包括全球和地区、经验水平和图书馆类型。它还强调了图书馆领域认为趋势之间最紧密的联系,特别是不断变化的知识实践与技术趋势、信任的重新谈判和数字公平之间的联系。 在《趋势报告文献综述》发布后,国际图联通过其邮件列表和社交媒体进行了一项调查。这既旨在根据对与知识和信息相关的其他出版物的广泛审查,对所呈现的趋势进行反思,又确定我们社区认为最有可能的趋势交叉点。 通过这种方式,该调查将有助于实现报告的下一阶段——一系列情景,建立知识和信息的潜在未来,作为思考我们如何为未来做好准备的基础。 概括而言,趋势是: 趋势 1:知识实践正在发生变化,未来知识体系的公平性既有机遇也有挑战。 趋势 2:AI 和其他技术正在改变社会,以及我们创建、共享和使用信息的方式。 趋势 3:信任正在被重新协商,尤其是在政府和媒体中。 趋势 4:技能和能力变得越来越复杂,但也是必不可少的。 趋势 5:数字技术及其优势分布不均。 趋势 6:信息系统使用更多资源,影响地球。 趋势 7:人们正在寻求社区联系 – 分享空间是关键。 该调查于 2024 年 8 月 9 日至 29 日开放,包含两个关键部分。第一个侧重于收集有关 7 个趋势中每个趋势的积极或消极程度的观点: 这里的想法是了解受访者对趋势的乐观程度,每个趋势都有潜在的积极和消极方面。他们还旨在激发思考宏观情况(对于一般社会或图书馆)与受访者自己的图书馆更直接的情况之间的差异。通过询问对图书馆的需求,它旨在了解受访者如何预期对图书馆服务的需求不断发展。 第二部分着眼于参与者认为重要的每个趋势,该趋势与其他趋势的关系有多强。 这将有助于我们确定定义场景的有趣领域。 此外,我们还收集了有关受访者类型(个人、协会/机构或 IFLA 单位)、他们所在的地区、他们在图书馆领域的多年经验以及他们工作的图书馆类型的数据。这使我们能够探索这些组之间的优先级是否不同。

    发布时间: 2024-10-31

  • 57. 数据要素嵌入对企业知识流动的影响研究
    程冰
    【目的/意义】在数字经济时代,数据要素的嵌入进一步推动了企业开放式创新进程,在多主体互动互补、多 因素震荡交织的环境下,知识流动所带来的异质性资源对创新实现的价值逐步凸显,所以开展数据要素嵌入与知 识流动间关系的研究对进一步理清企业创新发展的驱动因素具有重要意义。【方法/过程】本研究以 2012—2022年 中国 A股上市公司为样本,采用多元回归的方式实证分析了数据要素嵌入对企业知识流动的影响机制。【结果/结 论】研究结果显示:数据要素嵌入对企业知识流动会产生积极的促进作用,并且吸收能力能够发挥一定的中介作用,在高新技术企业中,数据要素嵌入对知识流动的影响效果较强,无论企业位于我国东部、中部或西部数据要素 嵌入都会对知识流动产生显著影响。【创新/局限】本研究将BERTopic模型与文本分析法相结合对数据要素嵌入的相关指标进行了完善,但由于知识流动是复杂、难以准确衡量的活动,如何进一步完善知识流动的测度方式是未来研究可以改进的方向。

    发布时间: 2025-07-23

  • 58. 基于事件的数字博物馆文物多粒度知识组织与服务
    程冰
    [目的/意义] 面向各类文物数据资源的语义模型与逻辑一致、使用灵活的文物知识组织方法与信息服务框架,为博物馆实现高质量的信息化转型提供多样化、个性化的公共数字服务提供理论基础与实践指引。[方法/过程] 首先,提出事件多粒度语义模型的相关基本概念,以粒度的形式化描述为基础,刻画事件要素多元粒度的基本结构特点;其次,针对文物知识描述、管理与应用需求提出多粒度文物事件知识模型和组织框架,基于事件多元粒度对文物知识的表示与组织进行深入分析;最后,提出基于多粒度模型的典型文物信息服务方法,从文物知识的多粒度推荐与展示两方面探讨上述方法支持下的典型文物信息服务应用场景与特点。[结果/结论] 从事件知识的多粒度建模角度提出一种新的文物知识描述与组织方法,构建起一个文物信息服务框架,为新时代数字博物馆建设提供一定参考。

    发布时间: 2025-07-22

  • 59. 德国将成立“超级高科技部”
    程冰
    2025年4月11日,《科学》Career栏目报道,德国新政府于4月9日公布了一份144页的联盟协议,预计5月初获批实施。协议包括德国将成立“超级高科技部”,负责研究、技术和航空航天领域,还计划吸引海外科学家,并简化大学在国防研究方面的合作。协议列出了新政府的若干科学优先事项,包括支持人工智能、量子技术、生物技术、芯片研发以及聚变能源等,希望在德国建成世界上第一个商用聚变反应堆。协议指出了面对美国科学预算削减及国际人才流动形势,德国计划启动一项"1000 Minds"全球引智项目,以吸引国际人才。本协议还表明,这是德国30年来首次将研究与教育职能分离,并将航空航天纳入同一行政架构。

    发布时间: 2025-07-23

  • 60. 基于大语言模型的红色档案资源交互式知识发现研究——以《南方局党史资料大事记》为例
    程冰
    [目的/意义] 为探究生成式人工智能与红色档案资源的深度融合路径,从而推动红色档案资源的知识发现。[方法/过程] 以《南方局党史资料大事记》为例,数字化处理红色档案资源,构建基于选定文本的知识库与向量数据库,搭建基于大语言模型的红色档案资源交互式知识发现框架。通过结合检索增强生成和结构化多轮问答应用大语言模型,进行实体抽取、人物轨迹提取等任务,提出生成式人工智能与红色档案资源相结合的新路径。[结果/结论] 实例表明,该框架可有效突破传统档案资源开发的技术壁垒,提供用户友好的交互式问答系统,并支持知识图谱等多维度叙事化展示,不仅为红色档案活化利用提供“AI+档案”的创新范式,更通过可拓展的技术框架为档案学者与相关部门提供参考。

    发布时间: 2025-07-22

  • 61. 早期研究人员的开放科学实践指南
    程冰
    荷兰大学图书馆联盟和荷兰国家图书馆(UKB)与荷兰大学(UNL)、荷兰国家研究数据专业中心和荷兰研究委员会(NWO)共同发布了一本关于开放科学的实用指南。 开放科学 可靠的科学不是仅靠超人智慧的工作,而是一个协作的过程。研究人员依赖并建立在彼此的研究成果上。我们共同构建理论、收集证据和评估同行的研究。然而,只有当我们确切地了解我们的前辈所做的事情时,我们才能建立在他们的工作基础上:他们的方法、相关材料、数据和结果是什么?因此,健全的科学理想上等同于开放科学,其中研究周期的所有阶段都尽可能透明和可访问。 关于本指南 刚开始的研究人员在向开放科学的转变中扮演着重要角色,因此这份指南面向荷兰大学和研究机构的所有学科的博士候选人、研究硕士学生和早期职业研究人员。它旨在陪伴研究人员在他们研究的每个阶段,从准备研究项目和发现相关资源(第2章)到数据收集和分析(第3章),撰写和发表文章、数据和其他研究成果(第4章),以及推广和评估(第5章)。每一章都为您提供了最佳的工具和实践,以便立即实施。您可以在当地的开放科学社区(见第6章)和大学图书馆找到其他研究人员或支持人员。 本指南建立在"开放科学的护照.针对博士生的实用指南"的基础上,由Loek Brinkman,Elly Dijk,Hans de Jonge,Nicole Loorbach,Daan Rutten等人撰写。(Paris, 2020)。 知识共享许可 CC BY-SA 4.0 授权。

    发布时间: 2023-07-11

  • 62. 生成式 AI 如何构建更好的抗体
    闫亚飞
    抗体是免疫系统对抗感染的主要武器之一。这些蛋白质已成为生物技术行业的宠儿,部分原因是它们可以被设计成附着在几乎任何可以想象的蛋白质上,从而操纵其活动。但斯坦福大学的计算生物学家 Brian Hie 表示,生成具有有效特性的抗体并对其进行改进优化,涉及“大量的强力筛选”。 为了了解生成式 AI 工具是否可以减少一些繁重的工作,Hie、Kim 团队使用了称为蛋白质语言模型的神经网络。这些类似于构成 ChatGPT 等工具基础的「大型语言模型」。但是,蛋白质语言模型不是被输入大量文本,而是在数千万个蛋白质序列上进行训练。 研究人员已经使用此类模型来设计全新的蛋白质,并帮助以高精度预测蛋白质的结构。Hie 的团队使用了一种蛋白质语言模型——由 Meta AI 的研究人员开发——来建议抗体的少量突变。 在它学习的近 1 亿个蛋白质序列中,该模型只接受了几千个抗体序列的训练。尽管如此,该模型的建议中有惊人的高比例提高了针对 SARS-CoV-2、埃博拉病毒和流感的抗体与其目标结合的能力。 改变批准用于治疗埃博拉病毒的疗法和 COVID-19 疗法可以提高这些分子识别和阻断这些病毒用来感染细胞的蛋白质的能力。(Hie 表示,COVID-19 抗体对 Omicron 及其亚变体无效,人工智能引导的变化不太可能恢复有效性。) Kim 说,许多建议的抗体变化发生在与其靶标相互作用的蛋白质区域之外,这通常是工程工作的重点。他补充说:「该模型所涉及的信息甚至对抗体工程专家来说都是完全不明显的……对我来说,这就是『天哪,这是怎么回事?』时刻。」 「这是人们用来改善抗体的工具。」英国牛津大学免疫信息学研究员 Charlotte Deane 说,「我觉得这真的很酷。」 但她补充说,许多研究人员希望,生成式 AI 不是简单地改进现有抗体,而是能够创造出全新的抗体,这些抗体将与选定的目标结合。 Nabla Bio 的联合创始人 Surge Biswas 说,这种能力可以帮助研究人员开发针对抵抗其他抗体设计方法的分子靶标的药物,该公司正在应对这一挑战。 例如,人工智能可以帮助解决 G 蛋白偶联受体问题,G 蛋白偶联受体是夹在细胞膜中的一类蛋白质,与神经系统疾病、心脏病和无数其他疾病有关。Biswas 说,生成式 AI 还可以帮助设计能够锁定多个目标的抗体药物,例如设计肿瘤蛋白和可以杀死肿瘤的免疫细胞。 斯坦福大学生物工程师 Possu Huang 表示,蛋白质语言模型功能强大,非常擅长优化现有蛋白质,包括抗体。但仅在蛋白质序列上训练的模型可能难以产生识别特定蛋白质的真正新抗体。 研究人员表示他们正在取得进展。2023 年 3 月,位于华盛顿州温哥华的生物技术公司 Absci 的科学家们在 bioRxiv 发布的预印本中报告了他们所说的用 AI 制造新抗体的第一步。他们使用包含蛋白质序列和实验数据的模型,为用于治疗乳腺癌的抗体药物的几个重要区域生成了新设计。

    发布时间: 2023-07-11

  • 63. 数智赋能下的我国数字政府建设模式研究
    程冰
    目的/意义】数字中国建设的背景下,探究我国数字政府建设模式,有助于推进政府数字化持续高水平发 展。【方法/过程】以访谈资料和案例资料作为有效样本,运用扎根理论识别与提取数字政府建设水平影响因素,构 建数字政府建设影响因素模型,并通过 fsQCA揭示各影响因素的组态效应,得到我国数字政府建设的四种典型模式,并从核心优势、潜在劣势、适用情形三方面对四种模式进行对比分析,最后针对性地提出优化策略。【结果/结 论】研究发现,我国数字政府建设整体呈现为四种模式:需求导向型、技术引领型、场景服务型、融合发展型;数字技 术水平在数字政府建设的影响机制中发挥重要作用;在不同地区、不同阶段应根据实际需求进行数字政府建设的 差异化推进。【创新/局限】技术迭代导致数字政府建设模式持续演变,未来需从动态视角跟踪技术趋势,灵活调整 策略,以精准把握其演变规律。

    发布时间: 2025-07-23

  • 64. 面向关键核心技术领域的科技情报感知服务体系构建研究
    闫亚飞
    1.构建多主体合作的情报感知体系,实现智慧协同与情报流转 在科技情报感知体系中,情报协同主体始终居于主导地位,在情报感知的生命周期中,情报需求的感知则处于首要地位。早在二战时期,美国社会科学委员会、学术团体、情报领域学者、情报机构就联合建立战略情报局,以此识别国家的情报导向需求,这开创了学界与情报界协同合作的先河。中国科学院文献情报中心刘细文等人认为协同战略情报研究是未来科技情报的首要工作模式。在传统的科技情报协同平台中,领域专家一直处于核心位置。但是对于关键核心技术,仅依靠领域专家可能会存在思维定势及认知偏差等原因导致科技情报感知有误差。再加上关键核心技术本身具有的潜在性、颠覆性等特征使其更加难以被发现与感知,这就需要引入大众智慧,扩大情报响应范围,增强科技情报识别与预测的准确性、全面性、及时性。当然大众智慧并不是指所有群众或网民评选,更多是依靠该领域的长期关注者,人员选取主要包括该领域相关网站的核心用户、该领域的青年学者、企业、工业人员等,同时还应建立信任和激励机制,吸引其他学科领域群体持续广泛的参与。。从协同主体的组织模式出发,情报感知的各主体应形成良好的组织结构。一方面科技管理与决策部门应“下好全国一盘棋”,为关键核心技术的攻关建设国际一流的科技情报服务中心,发挥领导、统筹作用,提升科技情报感知能力;另一方面,其他情报协同主体应保持扁平化设计,彼此间形成横向沟通网络,以平等互惠的原则吸纳不同领域、不同行业的情报机构及人员,以此拓宽情报协同平台的网络结构。总体来说,关键核心技术领域情报感知协同平台的主体主要包括科技智库机构、科技管理部门、领域与战略专家、情报咨询机构及大众群体。由科技管理与决策部门作为主导,科技情报机构作为协同平台的情报枢纽,有效识别国家决策需求,分析关键核心技术的发展态势。同时,科技情报机构还需在协同平台中充分承担情报共享与情报重构的责任,实现不同主体间的情报流通无阻。领域专家与大众间则需实现智慧协同,以此弥补专家所存在的思维定势、晕轮效应等问题。由于关键核心技术本身具有很强的跨学科协同性,高校、科研院所作为主要技术研发机构,在情报协同平台中并非以传统的单兵作战形式,而是以多学科团队交叉形式存在,综合多领域科学团队的情报意见,以扩大高校、科研院所对关键技术的态势感知具有先天优势。 2.打造多源异构的科技情报数据库,实现全源情报挖掘 在情报感知的生命周期中,情报采集是扫描、评估、刻画等过程的前提,在面向关键核心技术的情报感知体系中,情报协同平台在精准识别情报需求后需对所需情报进行采集。对于关键核心技术领域情报感知服务体系中的数据来源,由于关键核心技术所具有的潜在性、前瞻性、应用性等特征,传统情报库信息已经难以应对。因此情报协同平台首先要充分拓宽科技情报的元数据来源,根据原有情报库结合专家、大众智慧以及特定领域网络信息搭建全领域、全类型科技情报知识库。领域网络信息是指特定技术领域的相关信息,既包括专利报告、科技期刊、图书等结构化数据,也包括各技术、新闻等门户网站信息、国外情报、科技等网站信息、知识社交平台信息等非结构化数据。特别是对于关键核心技术的前瞻性特质,各国情报科技部门往往会发布科技前瞻评估报告,如韩国科技评估与规划研究院(KoreaInstituteofScienceTechnologyE valuationandPlanning,KISTEP)公布的《KISTEP十大新兴技术》以及知名咨询公司高德纳(Gartner)每年发布的《十大战略科技发展趋势》等技术报告文件。尽管全领域、全类型的科技情报密度高、容量大,但是由于大国博弈高度情报对抗条件下的开源情报来源的不可靠性逐渐增加,开源情报的欺骗效应也渐渐被用作国际间科技竞争的新型工具。鉴于国防与军事技术的高度敏感性,融合开源情报的全源情报成为国防科技情报研究保障的关键形式 。因此,在针对关键核心技术领域的情报采集过程中需要由开源情报向全源情报逐渐转变,利用全源情报消除开源情报的不确定性。总体而言,情报协同平台既需要打造多源异构的科技情报数据库,也需要将目光转向全源情报的收集与利用,以全源性思维和全源性手段实现对全部情报来源、全部利益相关体、全部情报人员思想等要素的综合考虑和应用,以此加强对潜在关键性技术的感知。 3.设置多重扫描指标,实现关键核心技术情报识别第一,关键核心技术领域指标设定。关键核心技术的形成遵循“10→3→1”收敛轨迹,这表明关键核心技术是逐步遴选收敛出来的。由于情报采集与归纳的多源异构数据与全源情报,其数量庞大、形式多样,如何根据情报需求,确定攻克关键核心技术所需的科技情报是首要任务。目前公认的科技数据扫描方法主要为基于大数据的专家思想碰撞的方式,研究认为对于关键核心技术的隐蔽性及前瞻性,单一指标难以实现精准探测,因此关键核心技术指标的设定应包括广域扫描指标与特定领域扫描指标两种。广域扫描指标用于对多源异构数据库进行初步整体非定向扫描,以便用于专家遴选,根据其作用功能。根据关键核心技术的主要特质和学者们的研究,本文对初级指标的框架进行表述。对于颠覆性指标的设定,研究根据Christensen及栾春娟等等的研究,将其分解为四个维度,这四个维度分别代表了关键核心技术的不同颠覆领域。前瞻性的指标分为该技术是否对行业、技术具有预见作用,能够精准捕捉未来技术的发展态势。垄断性主要是指该技术具有难以模仿的特质,对于情报感知体系来说,还要精准判断该技术的研发能否保持长期垄断以及是否具有较高的垄断价值。潜在性的判别指标是要识别该技术目前的发展现状,是否为潜在性技术,同时该技术的潜在价值如何。夏绪梅等认为关键核心技术具有高投入的特性,同时政府还要判别投入所形成的成果产出,因此本研究将高投入性指标设为投入指标与产出指标。特定指标用于特定技术领域与交叉技术领域评审。由于关键核心技术具有交叉性、融合性、长期性,这需要对某个领域进行长期监测,同时还需多领域专家共同评审。因此该指标需要根据关键核心技术的本质特征与所在领域前沿技术特征相结合,根据不同领域、行业的现状,遴选不同专家进行指标设定。第二,关键核心技术领域数据扫描与识别。根据已设定的技术指标,情报感知体系将根据技术评价指标及专家智慧,对多源数据进行扫描与识别。对于广域技术扫描,其核心在于动态全域监测,监测范围广,监测结果粗度较高。对于特定领域技术扫描,其核心在于智能情报挖掘,识别特定技术领域与交叉技术领域发展态势,要求保持较细粒度。但是无论是广域扫描还是特定扫描,都需要对科技数据进行多轮迭代筛选,以此捕捉技术弱信号。由于地平线等扫描系统主要侧重于技术的热度、突变度等特征,缺乏综合维度的评估,难免存在误差,需要结合专家与大众智慧。即技术数据迭代筛选的过程也是人机协同的过程。因此科技情报数据识别的过程主要包括四个阶段。 a.科技数据初筛选。该过程是机器智慧的集中体现,需要同时对特定领域与非特定领域利用不同指标进行广域扫描。机器智慧首先利用大数据挖掘分析等方法对科技情报数据进行初步整体的非定向扫描,根据突变度、新兴度、热度等维度对潜在技术进行评估,同时根据初步指标对技术进行遴选,将机器识别为关键的技术存至技术清单1。对于特定领域及交叉领域所进行的定向扫描,机器智慧利用特定指标与交叉指标进行技术筛选,对认定为关键的技术存至技术清单2。对于清单2中的技术还需要利用机器智慧绘制技术交叉图谱、演化趋势图,辅助领域专家评审。 b.科技数据再筛选。该过程是专家智慧与大众智慧的集中体现。对于预选技术清单1,领域专家需要联合大众智慧,根据机器智慧所提供的相应技术信息,如技术突变点、研究机构、国家等结合初步指标进行关键技术判定,以此实现第一轮的智慧融入。专家评分后,将保留于清单1中的技术进行二轮迭代,同时在迭代中引入新探测技术。通过技术筛选的不断反复,逐渐完善技术清单1并交至数据平台。对于技术清单2,需要结合特定领域及跨学科的专家团队智慧,该领域专家根据机器提供的技术交叉图谱、演化趋势图进行分析,之后根据特定指标或交叉指标对技术清单2进行审验,发现清单漏洞并对谱系结构、技术演化图谱予以完善,之后进行多轮迭代,最后提交至数据平台。 c.科技数据提交。技术清单1与清单2录入数据平台后,由跨学科团队进行专家审定,验证其科学性,对于存在漏洞的技术清单应反交至上层清单,重新审验。之后根据科技管理部门情报需求按领域、按行业进行情报决策支持并将所需技术清单及相关情报提供给情报协同平台。 d.科技数据归档。即将最终所得技术清单进行分档归类,该过程由情报协同平台完成。情报协同平台需要综合全球核心技术领域知识库、案例数据库等分类原则,建立符合我国科技管理及相关部门所需的重点跟踪科技库和专题科技库。对于归档后的科技情报数据,应该保持定期监测,本文也基于此建立五维监测体系。 4.态势监测与技术演化导航,实现情报刻画与评估情报刻画可以被解释为“以促进感知的形式呈现。”正如钱学森曾说“情报是激活了的知识”。因此,情报刻画与评估便为情报感知的激活与具体展示。在科技情报感知体系中,情报刻画与评估的首要目的是根据扫描与识别的结果绘制关于关键核心技术的情报产品。情报产品主要包括场景模拟、技术监测与技术演变导航与图谱绘制。 4.1技术发展态势监测关键核心技术发展态势的监测包括监测该技术市场潜力、其他国家的应用案例、政策、监管与道德伦理问题等。通过了解海外先进技术最新发展情况,以及国外对该技术的应用政策、技术开发和部署情况,为我国科技管理部门提供决策支撑。事实上,欧盟早已经开展对关键核心技术的态势监测,其主要是从“技术”“领域”“国家”三个维度进行布局,以此实现技术监测。在我国也有学者根据学科分类体系对技术监测进行探讨。本文结合以往学者与国家的研究,建立“国家”“技术”“领域”“技术特质”“技术交叉”的五维监测体系。国家维度包括主要研发国家。对于产业领域维度,国际普遍使用《国际标准产业分类法》,本文依据该法案及欧盟的产业领域分类方法,将产业领域划分为27类。技术维度则为科技情报数据的识别成果,将所识别的关键核心技术归纳于产业领域之中,并发现其中的领域交叉与技术交叉,根据技术交叉绘制演化导航与交叉图谱。技术特征维度用于评估该关键核心技术的全面特征,指标主要使用已构建的交叉指标与特定指标。根据监测体系,还可以实现智能情报检索。比如利用监测体系分析美国在化工产业的关键技术发展现状、国家之间技术领域对比、识别潜在的技术交叉趋势等。 4.2技术演化导航与图谱绘制智能情报是技术演化导航与图谱绘制研究的起源。钱学森先生早在1983年便提出过智能情报的相关观念,并认为情报研究的发展需要长期与智能技术相结合。技术演化导航与图谱绘制是关键核心技术领域情报感知服务体系的主要成果之一。技术演变导航与图谱绘制的重要性在于将不同领域之间技术的交叉融合、技术演变的关键节点、技术分支脉络都予以诠释。对于已归档分类的科技情报数据,动态监测其发展态势是必不可少的程序。黄祥喜等提出构建智能情报检索系统,以此实现技术演变路径的快速导航。但以此方式实现的快速导航具有信息迟滞,同时难以实现更深层次的情报挖掘。本文认为利用场景模拟方法对五维检测体系中的技术演化进行模拟复现是实现导航的有效途径。利用场景模拟方法将分布在时间、空间不同维度的技术导航进行关联,发现潜在新兴交互技术。同时通过多场景模拟,对新兴技术应用的可能性、与其他技术之间的耦合性进行判断,以此提高潜在技术的挖掘。关键核心技术的谱系绘制还有利于分析科技演化路径的拐点、异常点、突变点,针对突变点进行情报搜集以实现预测情报服务。对于场景模拟的方式,则可以尝试众包激励,鼓励大众进行市场模拟或者利用数字孪生技术进行虚拟仿真。 4.5反馈科技需求,实现情报响应情报响应在《情报与文献工作辞典》中被定义为,情报接受者对情报产品的接收情况。在科技情报感知体系中,情报响应既是情报采集、情报扫描、情报刻画、评估的响应,也是将情报产品提供给科技管理部门的响应;既是情报过程的响应也是情报主体间的响应。就情报主体间的响应而言,该过程是情报协同主体根据我国科技决策部门的需求,响应情报感知体系在科技情报采集、扫描、识别、刻画、评估等方面的能力,提前感知“卡脖子”技术问题对我国经济、社会、政治等方面可能造成的影响,形成情报产品并将所生成的情报产品提供给科技决策管理部门,为我国关键核心技术的攻关提供情报需求的过程。通过情报响应,以期加强我国在前沿技术、关键核心技术等方面的科技预测、预测能力,支持我国科技发展决策,避免或减少我国科技安全与发展以及国家整体利益受到侵害。

    发布时间: 2023-07-11

  • 65. 信息来源特征对科学知识采纳的影响研究--石静,吴柯烨,孙建军
    黄雨馨
    信息来源特征对科学知识采纳的影响研究--石静,吴柯烨,孙建军 石静,吴柯烨,孙建军 1. 南京大学数据智能与交叉创新实验室,江苏 南京 210023 2. 南京大学信息管理学院,江苏 南京 210023 摘要 [目的/意义] 科学研究为技术创新提供知识基础,技术创新吸收利用科学知识是重要的技术创新方式。在技术创新过程中被采纳的科学知识,作为基础研究与技术创新的桥梁,其特征对采纳效果的提升发挥着重要作用。前人研究证明,知识的来源特征作为一种便捷的价值呈现方式,会对受众的注意力分配与信息筛选过程产生影响。但这种影响在从科学到技术这一跨界信息传播过程中是否存在、有何表现,仍待探究。[方法/过程] 本研究从专利引用论文的视角探究技术对科学知识的采纳,构建1800—2018年全领域专利引用论文的数据集,测度科学知识的来源特征,分析其分布情况、变化趋势,并进一步构建回归数据集,使用回归模型,探究来源特征对采纳强度、采纳速度、采纳广度的影响。[结果/结论] 结果显示:①科技融合创新成为趋势,创新活动更加精细化,科学知识被技术采纳的速度提升,但广度与强度降低;②科学知识来源特征显著影响采纳效果,来自更高影响力生产者与传播者的科学知识,效果更好;③科学知识的技术采纳过程具有明显的学科领域差异,实践性较强的领域科学知识利用虽然更多、更迅速,但这些知识往往不能产生较强的技术影响力。 关键词 科技创新 / 知识采纳 / 来源特征 / 效果评估 / 专利引用

    发布时间: 2023-10-10

  • 66. 元宇宙场域视角下高校图书馆文献信息资源 创新服务模式研究
    闫亚飞
    高校图书馆的内外部环境处于动态变化之中,其整体需求也随之而变。然而从高校图书馆文献信息资源服务的变革历程来看,需求变革始终围绕着空间、人、资源三要素展开,与此对应的环境需求、用户需求和资源需求是图书馆存在和发展的不竭动力。通过识别高校图书馆文献信息资源服务需求,合理配置高校图书馆各服务要素,能够将高校图书馆打造成跨学科交流中心,形成多门学科资源与用户知识交流的服务生态圈。在此过程中,元宇宙的理念足够创新、技术十分多元,能够打破时空、虚实的界限,进一步统筹高校图书馆空间、人、资源三要素。多维度服务要素的群聚效应则促进了高校图书馆实现物理空间与虚拟空间高度融合、虚拟现实技术与需求高度配合、线上与线下资源高度协调的最终目标,驱动文献信息资源服务产生场域共振,从而提升高校图书馆文献信息资源服务水平。 1空间需求:元宇宙驱动空间环境重塑 图书馆以“空间”为要素历经“借阅空间”“传播空间”“交流空间”的发展和转变,空间要素的变化映射出图书馆适应人的需求和社会环境而做出的改变。由此可知,高校图书馆空间塑造是通过为用户提供舒适的空间体验来提高知识交流的效率。然而高校图书馆实体物理空间的再造成本较高,一般而言,高校图书馆实体空间改造的可变范围较小,通常从功能、环境和布局等层面进行空间重塑,且构建过程中需要充分考虑图书馆的基础服务和升级服务。当下高校图书馆服务仍以传统的书刊借阅和收藏鉴赏为主,师生的活动空间也主要集中于阅览室、自习室等实体空间,难以满足广大读者在移动互联网时代产生的新兴需求。高校师生读者思维转换十分迅速,对科技和信息的反应尤为灵敏,他们亟须一个能提供动态化、多样化、专业化服务的新型图书馆。然而,在已开展的为数不多的高校图书馆虚拟空间构建实践中,空间形态还不够真实,用户沉浸式学习体验需求尚未得到满足。高校图书馆具有支持学科建设的时代任务,利用好元宇宙虚拟现实技术能够开辟图书馆虚拟空间,促进实体物理空间与虚拟交互空间多维度学科知识互动,提高图书馆文献信息资源空间服务的能力。 2 用户需求:元宇宙驱动教学科研服务 高校图书馆是为教学和科学研究服务的学术性机构,其用户主体是在校师生,就该类型用户的需求而言,科研教学、学科专业依然是服务重点。在科研创新方面,数据驱动的新型研究范式使得用户的个性化知识需求日益凸显。高校师生长期从事科学研究工作,需要更加专业化的知识推送服务。因此,图书馆不仅要保障用户在陌生领域检索学科知识的基础需求,还要主动满足用户的多学科知识需求,面向用户多学科或“跨资源”知识需求形成有权重的创新知识点整合网络,为其推荐关联性高的显性知识和承载隐性知识的人才。在教学活动与专业学习方面,多门学科对于虚拟现实技术都有需求。如数理化类学科教学模型实物展示,通过对应的建模软件构建与课堂教学所需实物相同的模型;历史学科交互式虚拟教学软件,重现历史事件与场景;体育类学科模拟技能训练教学场景,其高度沉浸性能提高学习者专注力,免受外界环境干扰,还能规避训练中错误或危险动作带来的伤害。此外,创新成果越来越依赖大量科学实验数据,远程协作、实验研究或其他跨学科创新活动需求也逐步攀升。虚拟实验室系统能够对师生科研活动起到实际支持作用,如地理学科VGE知识平台、生命科学虚拟实验室系统、医学临床药物配方研究室等。在高校图书馆运用元宇宙技术,能够跨越不同专业教师和学生在时间和空间上的距离,把个性化知识服务扩展到网络覆盖到的任何角落,一定程度上能够满足多学科实验教学和科研创新的需求。 3 资源需求:元宇宙驱动学科交叉融合 学科交叉融合是科学研究的重要特征,各高校图书馆需发挥“馆+馆”力量,在资源整合和共享的基础上,实现科研人员的跨学科协同合作等。传统的图书馆资源支持仅立足于通过常规借阅、数字化资源服务实现单向、静态的知识交流;而跨学科资源支持则须为参与到跨学科交流中的师生群体提供各类知识资源,既包括以文献资料为主的各学科显性知识资源,如各类期刊、知识库、案例等“跨资源”,又包括承载隐性知识资源的载体——知识人,如学科专家库、人才库。构建跨学科资源平台,需注重各类知识资源的整合与协同共享。然而,各专业对于文献信息资源数量、来源和种类等要求各有不同,特别是对知识人资源具有远程访问要求。如数字人文领域包含计算机科学、图书情报学、艺术与人文学科、文学、语言学、历史、社会科学等诸多学科,学科之间的联系也越来越密切。随之而来的是跨学科研究者的学科背景和技术水平不一,因此需要虚拟现实互动平台辅助用户进行跨学科、跨专业协作。由此可知,跨学科研究对象的复杂化和研究问题的复合化特征突出,与之相应的大规模的存储处理和计算量需要高性能算力支持和高速率网络辅助。元宇宙3D时空互联网融合了5G泛在网、云存储/DB、云计算/算力等基础支撑技术,能够向场域内用户交付服务器、存储空间、数据库、网络和分析等的资源平台,从而为跨学科协同发展提供数据的存储、安全保护,以及元数据标引、规范化清洗整理、知识挖掘、创建数据关联等数据组织与管理服务网。

    发布时间: 2023-07-11

  • 67. 融合大语言模型结构化信息和主题语法图的评论摘要生成方法
    程冰
    [目的/意义] 针对现有评论摘要模型在生成过程中存在生成内容混乱以及属性词与情感词不对应的问题,提出一种融合大语言模型结构化信息和主题语法图的评论摘要生成方法。[方法/过程] 运用大语言模型GPT4.0抽取评论的结构化信息,利用句法依赖分析器提取句子的依存信息,通过语法图卷积神经网络获取语法特征向量,利用TextRank抽取主题信息,将主题信息和语法信息融合,通过交叉注意力机制分别获得包含主题语法信息引导语义信息的向量表示和包含结构化信息引导语义的向量表示,形成双通道信息,并获取融合注意力,替换指针生成网络的单通道注意力,最终生成评论摘要。[结论/结果] 相对于已有方法,提出的模型在ROUGE值评价指标上的效果相较于其他先进基线模型均有提升。生成的摘要更能符合评论文本原句的内容及顺序,能够缓解事实性错误的问题。

    发布时间: 2025-07-22

  • 68. 我国算法治理政策法规内容及框架分析--张涛,韦晓霞
    黄雨馨
    张涛,韦晓霞 黑龙江大学信息管理学院,黑龙江 哈尔滨 150080 摘要 [目的/意义] 数智时代算法在经济社会发展过程中发挥了重要作用,算法治理逐渐进入公众视野,算法治理目标的实现必须依靠各种政策法规的组合搭配,对我国算法治理政策法规现状的分析有助于促进算法健康、有序、繁荣发展。[方法/过程] 本文借助Nvivo12质性文本分析软件,以我国12部算法治理政策法规为样本,对其内容进行编码分析,同时提取概括出我国算法治理政策法规框架。[结果/结论] 我国算法治理当前存在缺乏总领性法律引导、主题分布不均衡、行业标准规范不细化、尚无地方专项政策的问题。基于此,本文提出我国应从提升算法治理“力度—深度—精度—广度”入手,逐步将较为零散的算法治理政策法规聚合成为具有中国特色的算法治理政策法规体系。 关键词 算法治理 / 质性文本分析 / 政策文本分析 / 算法治理政策法规

    发布时间: 2023-10-10

  • 69. 美国高校图书馆人工智能素养教育服务实践研究及其启示
    程冰
    [目的/意义]人工智能(Artificial Intelligence,AI)是新一轮科技革命和产业变革的核心,为确保学生能在AI时代保持竞争力,培育大学生的AI素养成为高等院校人工智能创新行动计划中人才培养的重要组成部分。通过分析国内外AI素养教育研究现状,探讨美国顶尖高校图书馆在AI素养教育方面的服务实践,为我国高等教育开展系统性和深入性的AI素养教育提供借鉴与启示。[方法/过程]通过调研2024年美国最佳国家大学排名中的前30所高校,深入探讨这些高校图书馆在AI素养教育方面的服务实践。[结果/结论]研究结果表明,许多高校图书馆已将AI素养教育纳入其服务体系,通过提供LibGuides,开展知识类、实践类和兴趣类等多样化的AI素养培训活动,介绍AI素养相关理论框架,并将其纳入战略规划,有效地提升学生对AI技术的理解与应用能力。这些服务实践为我国积极构建符合国情的AI理论框架和资源服务体系、建立完善的AI素养教育培训体系以及推动AI素养教育保障机制的建设提供重要启示。

    发布时间: 2025-07-22

  • 70. 2025年国家社科基金后资助项目申报公告发布
    程冰
    20205年6月16日,全国哲学社会科学工作办公室发布资助公告,2025年国家社会科学基金后期资助项目、优秀博士学位论文出版项目和优秀学术著作再版项目开始申报,集中受理申报时间为7月25日至30日。 一、资助对象: 后期资助项目:资助未出版的哲学社科优秀学术成果,以专著为主,少量资助资料汇编等,各学科(含教育学等单列学科 )可申报。 优秀博士论文出版项目:资助研究深入、创新高的优秀博士论文,支持优秀青年学者。 优秀学术著作再版项目:资助未受省部级以上资助、有显著影响的已出版著作修订再版 。 二、资助重点: 重点资助围绕习近平新时代中国特色社会主义思想、新时代历史性成就历史性变革、中国式现代化、国家治理体系和治理能力现代化、经济高质量发展、新质生产力、全过程人民民主、人工智能发展和治理、城市化和城市治理、建设中华民族共同体、边疆治理与边疆史、文化遗产保护传承、国家安全体系和国家安全能力现代化、中国特色大国外交、文明交流互鉴、人类命运共同体构建、党的自我革命等方向的重要理论和实践问题,以及哲学社会科学各学科领域的重要基础和前沿问题开展原创性研究取得的优秀学术成果。 三、项目类别与资助经费 分重点项目和一般项目。重点项目资助厚重、创新强、推动学科发展成果;一般项目资助学术价值高、有一定创新成果,申重点未达要求但达一般标准可立一般项目 。 资助经费:重点项目约 35 万元,一般项目约 25 万元,优秀博士论文出版项目约 20 万元,优秀学术著作再版项目 25 - 35 万元 。 详细相关申报要求请登录网站查看原文。

    发布时间: 2025-07-23

  • 71. LPC发布《图书馆出版伦理框架》2.0版本
    程冰
    LPC发布《图书馆出版伦理框架》2.0版本 LPC 发布图书馆出版伦理框架2.0版。一个专门的工作小组花了两年时间更新了图书馆出版联盟2018年框架。它引导图书馆出版商如何在他们的学科进行伦理思考。 图书馆工作和出版作为独立领域的道德规范已经确立,出版商可以向出版道德委员会(COPE)和其他权威机构寻求道德实践的指导;图书馆员可以依靠国际图书馆协会联合会(IFLA)的道德准则作为道德指导的一个来源,图书馆出版可从两者中得到伦理指导。但作为一个相对年轻的学科,图书馆出版也发现自己正在发展一种不同于其母领域的文化。 该框架包括4部分内容 框架1:图书馆出版以价值为基础 框架2:图书馆出版既是图书馆又是出版事业 框架3:图书馆出版是面向社区的 框架4:图书馆出版是动态的 相关信息可参考链接原文。 LPC 发布图书馆出版伦理框架2.0版。一个专门的工作小组花了两年时间更新了图书馆出版联盟2018年框架。它引导图书馆出版商如何在他们的学科进行伦理思考。 图书馆工作和出版作为独立领域的道德规范已经确立,出版商可以向出版道德委员会(COPE)和其他权威机构寻求道德实践的指导;图书馆员可以依靠国际图书馆协会联合会(IFLA)的道德准则作为道德指导的一个来源,图书馆出版可从两者中得到伦理指导。但作为一个相对年轻的学科,图书馆出版也发现自己正在发展一种不同于其母领域的文化。 该框架包括4部分内容 框架1:图书馆出版以价值为基础 框架2:图书馆出版既是图书馆又是出版事业 框架3:图书馆出版是面向社区的 框架4:图书馆出版是动态的 相关信息可参考链接原文。 LPC 发布图书馆出版伦理框架2.0版。一个专门的工作小组花了两年时间更新了图书馆出版联盟2018年框架。它引导图书馆出版商如何在他们的学科进行伦理思考。 图书馆工作和出版作为独立领域的道德规范已经确立,出版商可以向出版道德委员会(COPE)和其他权威机构寻求道德实践的指导;图书馆员可以依靠国际图书馆协会联合会(IFLA)的道德准则作为道德指导的一个来源,图书馆出版可从两者中得到伦理指导。但作为一个相对年轻的学科,图书馆出版也发现自己正在发展一种不同于其母领域的文化。 该框架包括4部分内容 框架1:图书馆出版以价值为基础 框架2:图书馆出版既是图书馆又是出版事业 框架3:图书馆出版是面向社区的 框架4:图书馆出版是动态的 相关信息可参考链接原文。https://librarypublishing.org/announcing-version-2-0-of-an-ethical-framework-for-library-publishing/

    发布时间: 2023-07-11

  • 72. 科技情报感知服务体系构建研究
    闫亚飞
    1.构建多主体合作的情报感知体系,实现智慧协同与情报流转 在科技情报感知体系中,情报协同主体始终居于主导地位,在情报感知的生命周期中,情报需求的感知则处于首要地位。早在二战时期,美国社会科学委员会、学术团体、情报领域学者、情报机构就联合建立战略情报局,以此识别国家的情报导向需求,这开创了学界与情报界协同合作的先河。中国科学院文献情报中心刘细文等人认为协同战略情报研究是未来科技情报的首要工作模式。在传统的科技情报协同平台中,领域专家一直处于核心位置。但是对于关键核心技术,仅依靠领域专家可能会存在思维定势及认知偏差等原因导致科技情报感知有误差。再加上关键核心技术本身具有的潜在性、颠覆性等特征使其更加难以被发现与感知,这就需要引入大众智慧,扩大情报响应范围,增强科技情报识别与预测的准确性、全面性、及时性。当然大众智慧并不是指所有群众或网民评选,更多是依靠该领域的长期关注者,人员选取主要包括该领域相关网站的核心用户、该领域的青年学者、企业、工业人员等,同时还应建立信任和激励机制,吸引其他学科领域群体持续广泛的参与。。从协同主体的组织模式出发,情报感知的各主体应形成良好的组织结构。一方面科技管理与决策部门应“下好全国一盘棋”,为关键核心技术的攻关建设国际一流的科技情报服务中心,发挥领导、统筹作用,提升科技情报感知能力;另一方面,其他情报协同主体应保持扁平化设计,彼此间形成横向沟通网络,以平等互惠的原则吸纳不同领域、不同行业的情报机构及人员,以此拓宽情报协同平台的网络结构。总体来说,关键核心技术领域情报感知协同平台的主体主要包括科技智库机构、科技管理部门、领域与战略专家、情报咨询机构及大众群体。由科技管理与决策部门作为主导,科技情报机构作为协同平台的情报枢纽,有效识别国家决策需求,分析关键核心技术的发展态势。同时,科技情报机构还需在协同平台中充分承担情报共享与情报重构的责任,实现不同主体间的情报流通无阻。领域专家与大众间则需实现智慧协同,以此弥补专家所存在的思维定势、晕轮效应等问题。由于关键核心技术本身具有很强的跨学科协同性,高校、科研院所作为主要技术研发机构,在情报协同平台中并非以传统的单兵作战形式,而是以多学科团队交叉形式存在,综合多领域科学团队的情报意见,以扩大高校、科研院所对关键技术的态势感知具有先天优势。 2.打造多源异构的科技情报数据库,实现全源情报挖掘 在情报感知的生命周期中,情报采集是扫描、评估、刻画等过程的前提,在面向关键核心技术的情报感知体系中,情报协同平台在精准识别情报需求后需对所需情报进行采集。对于关键核心技术领域情报感知服务体系中的数据来源,由于关键核心技术所具有的潜在性、前瞻性、应用性等特征,传统情报库信息已经难以应对。因此情报协同平台首先要充分拓宽科技情报的元数据来源,根据原有情报库结合专家、大众智慧以及特定领域网络信息搭建全领域、全类型科技情报知识库。领域网络信息是指特定技术领域的相关信息,既包括专利报告、科技期刊、图书等结构化数据,也包括各技术、新闻等门户网站信息、国外情报、科技等网站信息、知识社交平台信息等非结构化数据。特别是对于关键核心技术的前瞻性特质,各国情报科技部门往往会发布科技前瞻评估报告,如韩国科技评估与规划研究院(KoreaInstituteofScienceTechnologyE valuationandPlanning,KISTEP)公布的《KISTEP十大新兴技术》以及知名咨询公司高德纳(Gartner)每年发布的《十大战略科技发展趋势》等技术报告文件。尽管全领域、全类型的科技情报密度高、容量大,但是由于大国博弈高度情报对抗条件下的开源情报来源的不可靠性逐渐增加,开源情报的欺骗效应也渐渐被用作国际间科技竞争的新型工具。鉴于国防与军事技术的高度敏感性,融合开源情报的全源情报成为国防科技情报研究保障的关键形式 。因此,在针对关键核心技术领域的情报采集过程中需要由开源情报向全源情报逐渐转变,利用全源情报消除开源情报的不确定性。总体而言,情报协同平台既需要打造多源异构的科技情报数据库,也需要将目光转向全源情报的收集与利用,以全源性思维和全源性手段实现对全部情报来源、全部利益相关体、全部情报人员思想等要素的综合考虑和应用,以此加强对潜在关键性技术的感知。 3.设置多重扫描指标,实现关键核心技术情报识别第一,关键核心技术领域指标设定。关键核心技术的形成遵循“10→3→1”收敛轨迹,这表明关键核心技术是逐步遴选收敛出来的。由于情报采集与归纳的多源异构数据与全源情报,其数量庞大、形式多样,如何根据情报需求,确定攻克关键核心技术所需的科技情报是首要任务。目前公认的科技数据扫描方法主要为基于大数据的专家思想碰撞的方式,研究认为对于关键核心技术的隐蔽性及前瞻性,单一指标难以实现精准探测,因此关键核心技术指标的设定应包括广域扫描指标与特定领域扫描指标两种。广域扫描指标用于对多源异构数据库进行初步整体非定向扫描,以便用于专家遴选,根据其作用功能。根据关键核心技术的主要特质和学者们的研究,本文对初级指标的框架进行表述。对于颠覆性指标的设定,研究根据Christensen及栾春娟等等的研究,将其分解为四个维度,这四个维度分别代表了关键核心技术的不同颠覆领域。前瞻性的指标分为该技术是否对行业、技术具有预见作用,能够精准捕捉未来技术的发展态势。垄断性主要是指该技术具有难以模仿的特质,对于情报感知体系来说,还要精准判断该技术的研发能否保持长期垄断以及是否具有较高的垄断价值。潜在性的判别指标是要识别该技术目前的发展现状,是否为潜在性技术,同时该技术的潜在价值如何。夏绪梅等认为关键核心技术具有高投入的特性,同时政府还要判别投入所形成的成果产出,因此本研究将高投入性指标设为投入指标与产出指标。特定指标用于特定技术领域与交叉技术领域评审。由于关键核心技术具有交叉性、融合性、长期性,这需要对某个领域进行长期监测,同时还需多领域专家共同评审。因此该指标需要根据关键核心技术的本质特征与所在领域前沿技术特征相结合,根据不同领域、行业的现状,遴选不同专家进行指标设定。第二,关键核心技术领域数据扫描与识别。根据已设定的技术指标,情报感知体系将根据技术评价指标及专家智慧,对多源数据进行扫描与识别。对于广域技术扫描,其核心在于动态全域监测,监测范围广,监测结果粗度较高。对于特定领域技术扫描,其核心在于智能情报挖掘,识别特定技术领域与交叉技术领域发展态势,要求保持较细粒度。但是无论是广域扫描还是特定扫描,都需要对科技数据进行多轮迭代筛选,以此捕捉技术弱信号。由于地平线等扫描系统主要侧重于技术的热度、突变度等特征,缺乏综合维度的评估,难免存在误差,需要结合专家与大众智慧。即技术数据迭代筛选的过程也是人机协同的过程。因此科技情报数据识别的过程主要包括四个阶段。 a.科技数据初筛选。该过程是机器智慧的集中体现,需要同时对特定领域与非特定领域利用不同指标进行广域扫描。机器智慧首先利用大数据挖掘分析等方法对科技情报数据进行初步整体的非定向扫描,根据突变度、新兴度、热度等维度对潜在技术进行评估,同时根据初步指标对技术进行遴选,将机器识别为关键的技术存至技术清单1。对于特定领域及交叉领域所进行的定向扫描,机器智慧利用特定指标与交叉指标进行技术筛选,对认定为关键的技术存至技术清单2。对于清单2中的技术还需要利用机器智慧绘制技术交叉图谱、演化趋势图,辅助领域专家评审。 b.科技数据再筛选。该过程是专家智慧与大众智慧的集中体现。对于预选技术清单1,领域专家需要联合大众智慧,根据机器智慧所提供的相应技术信息,如技术突变点、研究机构、国家等结合初步指标进行关键技术判定,以此实现第一轮的智慧融入。专家评分后,将保留于清单1中的技术进行二轮迭代,同时在迭代中引入新探测技术。通过技术筛选的不断反复,逐渐完善技术清单1并交至数据平台。对于技术清单2,需要结合特定领域及跨学科的专家团队智慧,该领域专家根据机器提供的技术交叉图谱、演化趋势图进行分析,之后根据特定指标或交叉指标对技术清单2进行审验,发现清单漏洞并对谱系结构、技术演化图谱予以完善,之后进行多轮迭代,最后提交至数据平台。 c.科技数据提交。技术清单1与清单2录入数据平台后,由跨学科团队进行专家审定,验证其科学性,对于存在漏洞的技术清单应反交至上层清单,重新审验。之后根据科技管理部门情报需求按领域、按行业进行情报决策支持并将所需技术清单及相关情报提供给情报协同平台。 d.科技数据归档。即将最终所得技术清单进行分档归类,该过程由情报协同平台完成。情报协同平台需要综合全球核心技术领域知识库、案例数据库等分类原则,建立符合我国科技管理及相关部门所需的重点跟踪科技库和专题科技库。对于归档后的科技情报数据,应该保持定期监测,本文也基于此建立五维监测体系。 4.态势监测与技术演化导航,实现情报刻画与评估情报刻画可以被解释为“以促进感知的形式呈现。”正如钱学森曾说“情报是激活了的知识”。因此,情报刻画与评估便为情报感知的激活与具体展示。在科技情报感知体系中,情报刻画与评估的首要目的是根据扫描与识别的结果绘制关于关键核心技术的情报产品。情报产品主要包括场景模拟、技术监测与技术演变导航与图谱绘制。 4.1技术发展态势监测关键核心技术发展态势的监测包括监测该技术市场潜力、其他国家的应用案例、政策、监管与道德伦理问题等。通过了解海外先进技术最新发展情况,以及国外对该技术的应用政策、技术开发和部署情况,为我国科技管理部门提供决策支撑。事实上,欧盟早已经开展对关键核心技术的态势监测,其主要是从“技术”“领域”“国家”三个维度进行布局,以此实现技术监测。在我国也有学者根据学科分类体系对技术监测进行探讨。本文结合以往学者与国家的研究,建立“国家”“技术”“领域”“技术特质”“技术交叉”的五维监测体系。国家维度包括主要研发国家。对于产业领域维度,国际普遍使用《国际标准产业分类法》,本文依据该法案及欧盟的产业领域分类方法,将产业领域划分为27类。技术维度则为科技情报数据的识别成果,将所识别的关键核心技术归纳于产业领域之中,并发现其中的领域交叉与技术交叉,根据技术交叉绘制演化导航与交叉图谱。技术特征维度用于评估该关键核心技术的全面特征,指标主要使用已构建的交叉指标与特定指标。根据监测体系,还可以实现智能情报检索。比如利用监测体系分析美国在化工产业的关键技术发展现状、国家之间技术领域对比、识别潜在的技术交叉趋势等。 4.2技术演化导航与图谱绘制智能情报是技术演化导航与图谱绘制研究的起源。钱学森先生早在1983年便提出过智能情报的相关观念,并认为情报研究的发展需要长期与智能技术相结合。技术演化导航与图谱绘制是关键核心技术领域情报感知服务体系的主要成果之一。技术演变导航与图谱绘制的重要性在于将不同领域之间技术的交叉融合、技术演变的关键节点、技术分支脉络都予以诠释。对于已归档分类的科技情报数据,动态监测其发展态势是必不可少的程序。黄祥喜等提出构建智能情报检索系统,以此实现技术演变路径的快速导航。但以此方式实现的快速导航具有信息迟滞,同时难以实现更深层次的情报挖掘。本文认为利用场景模拟方法对五维检测体系中的技术演化进行模拟复现是实现导航的有效途径。利用场景模拟方法将分布在时间、空间不同维度的技术导航进行关联,发现潜在新兴交互技术。同时通过多场景模拟,对新兴技术应用的可能性、与其他技术之间的耦合性进行判断,以此提高潜在技术的挖掘。关键核心技术的谱系绘制还有利于分析科技演化路径的拐点、异常点、突变点,针对突变点进行情报搜集以实现预测情报服务。对于场景模拟的方式,则可以尝试众包激励,鼓励大众进行市场模拟或者利用数字孪生技术进行虚拟仿真。 4.5反馈科技需求,实现情报响应情报响应在《情报与文献工作辞典》中被定义为,情报接受者对情报产品的接收情况。在科技情报感知体系中,情报响应既是情报采集、情报扫描、情报刻画、评估的响应,也是将情报产品提供给科技管理部门的响应;既是情报过程的响应也是情报主体间的响应。就情报主体间的响应而言,该过程是情报协同主体根据我国科技决策部门的需求,响应情报感知体系在科技情报采集、扫描、识别、刻画、评估等方面的能力,提前感知“卡脖子”技术问题对我国经济、社会、政治等方面可能造成的影响,形成情报产品并将所生成的情报产品提供给科技决策管理部门,为我国关键核心技术的攻关提供情报需求的过程。通过情报响应,以期加强我国在前沿技术、关键核心技术等方面的科技预测、预测能力,支持我国科技发展决策,避免或减少我国科技安全与发展以及国家整体利益受到侵害。

    发布时间: 2023-07-11

  • 73. 哈工大发布大模型思维链推理综述:200+文献全面解析大语言模型思维链推理最新进展
    闫亚飞
    01 引言 思维链,一种通过逐步思考解决问题的方式,在解决复杂推理任务上展现出了惊人的性能,激起了人工智能和自然语言处理领域近年来的广泛研究和关注。 然而,目前缺乏一篇针对思维链及其变体的系统性归纳和总结。针对这一问题,本文对现有思维链相关研究进行了广泛调研,对思维链构造方法、思维链增强方法、思维链结构变体进行了归纳和总结,对思维链前沿应用做出了探讨并对思维链未来潜在研究方向进行展望。 为了与传统链式思维链进行区分,本文提出了泛思维链(X-of-Thought)的概念,其泛指基于思维链核心思想——逐步思考解决问题的方法和变体。在下文中所讨论的思维链均代指广义的泛思维链。我们期望这篇综述能够为研究者和初学者提供参考和启发,激发更多关于思维链推理领域的深入探讨,推动该领域的进一步发展和创新。 02 背景介绍 2.1 范式转换 近年来,随着计算能力的不断提升,大规模语言模型如雨后春笋般涌现,例如 GPT,LLAMA,BLOOM。而随着语言模型规模的不断扩大,涌现出了许多令人惊喜的能力,例如上下文学习和思维链能力。因此,自然语言处理的范式正在从预训练+微调转变为预训练+上下文学习。 2.2 上下文学习和思维链推理 上下文学习(In-context Learning)通过在提示文本中添加输入-输出示例,通过少样本学习(Few-shot Learning)的方式让 LLM 模仿已有示例(demonstrations)解决新的问题。通过上下文学习,LLM 无需额外微调即可使用,并且还能取得不错的性能。尽管如此,其在面对复杂数学推理、常识推理等复杂推理任务时表现不佳。 思维链(Chain-of-Thought)推理要求模型在输出最终答案之前,显式输出中间逐步的推理步骤。这一举措大幅度提高了 LLM 在复杂推理任务上的表现,并且输出的中间步骤方便使用者了解模型的思考过程,提高了大模型推理的可解释性。目前,思维链推理已经成为大模型处理复杂任务的一个常用手段。 03 章节组织 我们将从三个角度介绍思维链相关方法,并且在最后进行了方法间的比较和讨论: 思维链方法(包含思维链构造方法、思维链结构变体、思维链增强方法) 思维链前沿应用(包含工具使用、决策规划、思维链蒸馏——提高小模型推理能力) 未来研究展望(包含多模态思维链推理、可信思维链推理——减少幻觉、思维链理论研究) 04 思维链方法 4.1 思维链构造方式 根据模型进行思维链推理所需的推理链条人工标注程度,我们将其分为手动、自动、半自动三种构造方式。 4.1.1 手动思维链构造 示例中的推理链条完全由人工标注。优缺点:人工标注推理链条具有较高质量,为少样本学习提供了优质的信号。但是人工标注需要较大的人力成本开销,并且会遇到示例选择难以优化、跨任务迁移困难等问题。 4.1.2 自动思维链构造示例中的推理链条完全无需人工标注。具体来说,它分为 Zero-shot CoT 和 Auto CoT 两种方式。前者通过特定的提示文本激发模型在没有示例的情况下生成推理链条;后者则是使用前者零样本生成的推理链条,并结合示例选择策略,通过少样本学习的方式生成推理链条。优缺点:自动思维链构造不需要人工标注极大减少了人工成本,并且由于无需针对任务设定示例,在不同任务间可以方便迁移。但是由于缺少高质量人工标注信号,其性能通常较差,时常会出现事实错误、逻辑错误等幻觉现象。 4.1.3 半自动思维链构造示例中的推理链条少量由人工标注。具体来说,人工标注少量推理链条作为“种子样例”,基于这些种子样例进行拓展得到大量的推理链条,之后通过示例选择通过少样本学习的方式生成推理链条。优缺点:半自动构造方法结合了前二者的优点,在推理性能和人力成本间达到了平衡。少量人工标注提供了高质量的信号从而提高了推理质量,并且自动的推理链条拓展也减少了人工成本,在不同领域间迁移也仅需对种子样例进行重新标注。 4.2 思维链结构变体最原始的思维链是链式结构,并且以自然语言描述中间推理过程。链式结构过于线性,一定程度上限制了它在复杂任务上的能力,为此许多研究对思维链的结构进行了探索。 4.2.1 链结构变体链式结构变体主要针对中间推理过程的形式进行修改。程序语言的执行和复杂数学推理的过程十分契合,一些工作提出使用程序语言代替自然语言,通过生成可执行程序作为推理链条,并执行该程序得到最终推理结果,例如 PAL、PoT。此外还有一些其他形式的中间推理过程,例如 Algorithm-of-Thought 将推理链条替换为算法的执行过程,激发大模型内部使用算法推理的能力,Chain-of-Symbolic 在规划任务中使用符号代替了复杂的环境。 4.2.2 树结构变体链式结构的思维链限制了探索的广度,一些方法显式地构造了树并引入了树搜索算法。结合树结构和树搜索算法可以对不同的推理路径进行探索,并且引入了回溯、自我评估、剪枝的操作,在复杂任务及规划任务上取得优秀表现(Tree-of-Thought)。此外有方法在中间步骤中额外引入了不确定性评估,一定程度缓解了由不确定性带来的推理级联错误(Tree-of-Uncertain-Thought)。 有些方法通过树结构加快推理速度,通过将问题分解成可以平行解决的子问题并行解码,但这种方法仅限于解决简单任务,无法处理复杂推理任务(Skeleton-of-Thought)。然而,当前的树结构变体方法在任务选择上有较大的局限性,并且需要针对任务设定具体的提示指令,这些困难阻碍了它的广泛应用。 4.2.3 图结构变体图结构相较于树引入了更复杂的拓扑结构。Graph-of-Thought 在推理中通过环结构引入了自我修复,并根据图拓扑结构引入了信息聚合,在处理复杂任务时有着更较优秀有的表现,但是其面临着和树结构变体类似的问题,阻碍了它的广泛应用。ResPrompt 通过在提示文本中引入了“残差链接”来连接、聚合不同步骤的推理结果,隐式地引入了推理步骤之间地图结构,可以在数学推理等通用任务上使用,并且取得了优秀的效果。 4.3 思维链增强方法针对思维链进行某一特性的针对性增强,例如添加推理步骤的验证和完善、引入外源知识、问题分解、多次采样并投票、提高效率等。 4.3.1 基于验证和完善大模型在推理过程中往往会出现幻觉现象,例如事实性错误和逻辑性错误。通过引入针对推理过程的验证来获取反馈信号,并根据该反馈讯号对推理进行完善可以一定程度缓解这种现象。一个简单的思路是对推理步骤进行校验,例如通过演绎推理检验前后推理的一致性(Verify-CoT)、对每一个推理步骤进行细粒度的校验(DIVERSE)。 事实性错误通常通过引入知识进行缓解,具体来说分为外源知识和内源知识。对于内源知识,模型在回答问题前,首先通过提示指令获取模型内部的知识,并基于这些知识进行推理(SCREWS、Chain-of-Verification、Crystal、Step-Back Prompting),外源知识的引入将会在后续章节中介绍。对于推理一致性,一些方法通过反向推理进行验证。具体而言,他们根据问题和模型的预测来推理问题中的条件,根据推测出的条件和真实条件的一致性来判断推理的正确性(RCoT、FOBAR、Self-Verification)。 4.3.2 基于问题分解 模型直接回答复杂问题是十分具有挑战性的,而回答简单问题则得心应手。因此将问题分解成子问题显式地一步步解决是一类有效的方法。 Least-to-Most 使用了自顶向下的问题分解策略,首先将问题一次性分解成若干子问题,之后逐个解决从而得到最终的答案;Successive Prompting 采取了一种迭代分解策略,每轮迭代分解一个子问题并解答,并使用其促进后续的问题分解和回答;Decomposed Prompting 采取模块化设计,对不同类型的子问题设计专属模块负责解答,提高了子问题解答的准确性。此外,BINDER 采取神经符号的方式,通过程序执行得到最终答案;DATER 则关注表格推理的问题分解,需要同时考虑问题和表格的分解。 4.3.3 基于外源知识模型内部存储的知识在预训练结束后便会定格,无法获取新的知识,导致知识的匮乏和过时。从维基百科、知识库、词典等途径引入外源知识,能够一定程度缓解这个问题。Chain-of-Knowledge 从知识库中获取结构化知识进行知识指导的推理,并且根据结构化知识对推理链条的真实性和可信性进行验证。KD-CoT 将多跳推理转化为多轮问答形式,在每轮问答中检索相关的事实知识辅助问答。 4.3.4 基于排序或投票由于语言模型是基于概率采样的,在生成文本时会具有一定的随机性,通过多次采样并对采样结果进行集成,可以有效地缓解这个现象,并显著提高推理的性能。一些工作在推理链条或答案层级进行粗粒度的集成,例如 Self-Consistency、Complex CoT、Verifiers。这种集成粒度过粗没有考虑到推理步骤,为此另一些工作考虑到了中间推理步骤进行细粒度的集成,例如 Self-Check、GRACE。除了通过概率进行采样外,Diversity-of-Thought 通过不同的提示文本来采样多跳推理路径。总的来说,基于多次采样的策略已经成为当前思维链推理中常用的技术。 4.3.5 效率提升尽管思维链推理已经展现出卓越的性能,其推理速度慢、使用开销大仍是不可忽视的问题。目前工作从减少推理链条标注成本、加快推理时解码速度和降低推理时的多次采样次数开销入手。 05 思维链前沿应用 5.1 工具使用 虽然大模型具有非常强大的知识水平,其依然缺乏对于时效性内容以及领域外知识的更新能力,并且语言模型在数学计算、符号推理上也较为薄弱,在遇到这些问题时往往会产生幻觉现象。 为此,许多方法探究如何使用外部工具对 LLM 进行增强,通过提示或微调等方式引入使用工具(调用 API)的能力。网页和知识库检索能够让模型获取最新的外部知识,数学计算器与程序执行可以用以处理更为复杂的计算问题,调用其他模型能够获得其他模态(图像、视频、语音)的理解以及生成能力,甚至是与外部环境进行感知与交互,实现具身智能。思维链推理在工具增强方法中起到了非常重要的作用。大多数情况下,模型对于工具调用的需求是隐含的。工具提高了大模型在单步“动作”下的处理能力,而思维链赋予了模型在推理过程中对于问题的分解,工具使用形式的思考以及工具调用结果的追踪处理能力。 5.2 决策规划 思维链提供了一种将问题分解为链式子问题的形式,从而处理较为复杂的问题。然而,对于更为复杂的任务,链式的分解形式并不充分。在前文中,我们介绍了将链式推理拓展到树结构、图结构等形式的工作。 除此之外,LLM+P,LLM+DP 等工作将问题分解为规划领域定义语言(Planning Domain Definition Language, PDDL)的形式,通过外部模块对过程进行规划调度,最终再转换回自然语言形式用 LLM 进行处理。这些方式都提供了更为灵活的分解以及调度过程,增强模型的规划能力。 在长期规划中,模型产生的错误会进行累积。并且在执行过程中可能会遇到计划外的错误,不断进行重试也无法得到正确的结果。因此需要提高模型在推理过程中对错误处理、总结,以及对计划更新的能力。Self-Refine 能够让模型对结果进行自我反馈以及优化,而 Reflexion 在此基础上加入长短期记忆,根据历史经验进行决策。AdaPlanner 等工作则能够根据环境反馈优化规划过程,提高灵活性。规划增强的方法可以与工具增强、多智能体等方法进行结合,进一步增强大模型在复杂问题上的处理能力。 5.3 思维链蒸馏 思维链被视为大模型的一种涌现能力,然而,这种能力在一些规模较小的模型上并不是很显著,限制了小模型在推理时的表现。 当模型具备一定的思维链能力时,可以通过自监督与自我迭代的方法对推理能力进行强化,例如 LMSI,STaR 等。 但大多数情况下,小模型的思维链能力较弱,难以输出可靠的推理过程进行自我蒸馏。此时需要依靠具有较强思维链能力的大模型输出推理链条,再蒸馏给小模型,从而让小模型也获得一定的推理能力。一般来说,蒸馏时需要对数据进行筛选,有答案标签的情况下可以通过标注筛选出结果正确的推理过程,而在没有标注时也能通过 self-consistency 等方式投票得出较为可靠的答案。 除了推理结果的正确性外,推理过程的多样性对于蒸馏的效果也非常重要。SCoTD 发现针对每个样本采样多种推理路径能提高小模型的推理性能,SCOTT 通过对比解码和反事实推理等方式进一步提升思维链质量,缓解小模型学习到推理过程“捷径”的问题。 思维链的形式也会影响小模型的学习效果。DialCoT 将思维链过程拆解为多轮对话的形式,简化小模型的学习难度。MWPCoT 和 PlanningToken 等工作则在数学推理过程中引入高层次的信息表示,提高模型在推理过程中的一致性以及在不同问题上的泛化性。不过需要注意的是,模型在多维度能力上存在着非常复杂的权衡。虽然通过蒸馏和微调的方式可以提高小模型在专一领域的推理能力,这个过程同时会损害模型在其他通用领域的性能(Specializing-Smaller-LM)。 06 思维链未来研究方向 6.1 多模态思维链推理目前的多模态思维链推理主要集中在图文领域,使用小模型进行微调,尚处于早期研究阶段。基于视觉-文本基座大模型和视频推理任务上存在着很大的探索空间。 6.2 可信思维链推理 | 减少大模型幻觉基于大语言模型的思维链推理存在幻觉,如何减少幻觉,实现可信思维链推理是潜在的研究方向。 6.3 思维链理论思维链有着惊人的性能,但其背后的原理和能力边界仍处于未知状态。从理论上探究思维链的能力来源、能力边界以及其相较于上下文学习的优点,可以更好地指导并促进思维链应用。

    发布时间: 2023-12-01

  • 74. 类ChatGPT人工智能技术嵌入智慧图书馆:应用价值、潜在风险及防控策略
    于彰淇
    摘要:ChatGPT是人工智能领域的颠覆性成果,引起了社会各界的高度重视。将类ChatGPT人工智能技术嵌入智慧图书馆,对于智慧图书馆的创新与发展具有重要意义。文章采用历史研究法、文献调查法以及理论分析法,在梳理ChatGPT的发展历程及其主要技术特征的基础上,深入分析了类ChatGPT人工智能技术嵌入智慧图书馆的应用价值、潜在风险以及风险防控策略。研究显示,类ChatGPT嵌入智慧图书馆具有提高资源建设质量、优化用户服务体验、实现人员数智赋能、促进管理决策转型等应用价值,同时也存在知识产权保护难度上升、人机互动产生误导冲突、信息安全保护遭受冲击、管理决策过渡依赖技术、复合型馆员有严重缺口等潜在风险。对此,智慧图书馆应制定以下风险防控策略:构建版权协同保护体系、全面构建技术治理机制、完善数据安全保障体系、创新组织领导管理机制以及推动技术人力资源建设。

    发布时间: 2024-01-19

  • 75. 人工智能时代的社会秩序
    程冰
    人工智能对人类带来的挑战之一是其“去智化”功能正在产生“人工智残”现象,即由于滥用人工智能相关工具,导致人类自我智力伤害,从而对社会秩序产生深刻影响。“人工智残”现象的产生源于人工智能的2种结构性因素——技术结构特性和治理结构特征。技术结构特性表现为技术能力高度集中、管控高度集权、商用者高度垄断、使用者高度分散。治理结构特征则表现为高度等级化,形成一种“牧民社会”的治理结构,即人工智能自身快速发展,加速人类自我愚昧的进程,摧毁现行人类生活体制,从而逐渐扮演“牧羊犬”的角色。为改变这种趋势,政府应发挥核心作用,通过确立和强化政府的责任、网络平台责任、加强网络监测与情报收集、重塑教育与人类理性等方式,塑造人工智能时代的社会秩序。

    发布时间: 2025-07-23

  • 76. 调整论文格式可改善 AI 描述
    程冰
    2023年11月28日Nature新闻发布了Terence Day学者的一篇文章,他认为改变现有论文的风格可改善大模型的描述质量,减少大模型引入的错误。 ChatGPT 和其他基于大型语言模型(LLMs)的工具均提高科学研究效率,但在描述研究论文时也会引入错误(Nature 622,234-236; 2023),他建议对论文格式做一些小的改变,可以提高大型语言模型的训练质量。 例如,描述研究方法而不是引用参考文献,将使大型语言模型能够准确地总结方法。用第三人称写作可更清楚地识别个人,这需要传统科学写作风格的重大转变,但大型语言模型并不认识“我们”是谁。Terence Day建议只使用 DOI,没有期刊标题、卷和页码,DOI 使得验证引用更加容易。 大型语言模型为论文提供以第三人称和新闻风格撰写的扩展摘要,可改进人工智能生成的文献综述。这样的摘要将比传统摘要更有效突出工作的重要性,还提高机器和人类的可读性,有助于提高科学研究的社会意识。 以上为图情门户项目组编译,如需转载请注明出处。

    发布时间: 2023-12-01

  • 77. GLAM机构参与数字记忆项目开发:兴起背景、实践意蕴与实现路径
    程冰
    [目的/意义] 明晰GLAM机构参与数字记忆项目开发的背景、价值与路径,是数智时代数字记忆项目保持良性发展态势的必然要求。[方法/过程] 通过文献与网络调研,以国内外数字记忆项目为案例支撑,梳理GLAM机构参与数字记忆项目开发的兴起背景,从实践价值层面探明GLAM机构参与数字记忆项目开发的意蕴内涵,提出GLAM机构深度参与数字记忆项目开发全流程的实现路径。[结果/结论] GLAM机构参与数字记忆项目开发是数智时代的必然产物,在数字人文理论体系建构、开放共享服务平台建设、跨界协作融合互动增强、全民公众参与机制完善、记忆场域文化底蕴挖掘、数字叙事交互表达强化等层面具有一定的现实价值。为此,坚持以人本为核心、以开源为要义、以协作为手段、以服务为目标的开发路径,是GLAM机构保障数字记忆项目长期可持续性发展的实现路径。

    发布时间: 2025-07-22

  • 78. 图书馆信息支持如何促进社区矫正效果?
    程冰
    摘要:为了调查图书馆信息支持是否以及如何影响社区矫正效果,研究者对中国安徽省的504名社区矫正客户进行了问卷调查。结果显示,信息支持在压力中介的社会排斥与矫正效果之间的关系后半部分起到了调节作用,高水平的信息支持减弱了压力对矫正效果的影响;同时,它也调节了自我效能中介的社会排斥与矫正效果之间关系的后半部分,高水平的信息支持削弱了自我效能对矫正效果的影响。情感支持在压力中介的社会排斥与矫正效果之间的关系后半部分也起到了调节作用。本研究为图书馆服务于弱势群体提供了新的视角,并验证了信息支持在压力和自我效能对矫正效果影响中的调节作用。扩展了“压力源-压力-结果(SSO)”模型,并验证了影响矫正效果的模型。在实践中,图书馆信息支持有助于提高矫正客户的文化素养,增强他们的社会竞争力,扩大图书馆用户群体,提升矫正效果,并维护社会安全与稳定。 关键字:图书馆,信息支持,社区矫正,压力,自我效能,情感支持 https://www.tandfonline.com/doi/full/10.1080/24750158.2024.2442126

    发布时间: 2025-07-23

  • 79. 《论数据要素市场》:建设数据要素大市场
    程冰
    当前,数据要素市场建设已成为业界高频讨论的现象级重大课题。从战略思考到制度建设,从政策设计到技术供给,从场景拓展到商业模式,从市场导向到国家权利等等诸多领域不一而足,都不乏诸多研究者参与者。各位看到的这本专著,最基本的特色则是前瞻性、体系化和实践性。 我与作者即国家信息中心大数据部主任于施洋博士和另外两位博士已认识多年了,知道他们持续地深度参与研究并体验关于数据要素流通制度建设预研、数据交易所(中心)设计及创新实验等重要工作,坚持将完成主管部门交办(或地方政府委托任务)和超前开展前沿课题研究有机结合起来,逐步在数据要素市场领域形成了体系化的理论思考和实践总结。对作者们的不懈努力和专业水平以及责任担当我都比较熟悉,故欣然接受邀请写下这份序言。 细读此书总的体会主要有两点。 第一点是观念观点体现科学创新。如作者提出,将数据要素纳入收入分配体系,就如同改革开放以来每一次确立新的生产要素并纳入收入分配体系类似,如土地进入市场拍卖、劳动力商品化、建立资本市场等,都是一场牵涉经济社会发展方方面面的全局性改革。这就是把握数据要素市场发展大趋势的一个新的视角,就是必将催生和发展新的生产力,同时必将调整和完善生产关系。 再如,文中讨论数据要素与其它生产要素关系时,明确指出全要素数字化的过程,是重构原有产业的资源配置状态,实现互联网等数字化新技术与实体经济协同发展充分融合,推动形成智能化的数字经济体系的过程。这就启示我们,加速推进数字化新技术的研发与成果转化并壮大数字经济进程,必须与加速推动工业、农业和服务业现代化,以及社会治理现代化进程互为条件、有机融合。 再如,作者讨论数据要素问题时,提出应基于数据“动态本体论”分析框架,建立政企融合的全国一体化数据要素市场的基本思路,并据此率先提出“所商分离”“数据商”“数据资产入表”等一系列模式和理念,对指导实际工作具有较强实用性可操作性。 第二点是着力构建逻辑自洽体系。数据要素市场化是一个领域新、任务重、困难多、耗时长的事情,应该允许在局部地区、部分环节先行先试。同时,更需要在总体思路和基本路线图上提出一些“先知先觉”的基本思考。 我认为,作者着力论证的包括数据要素的产权体系、供给体系、流通体系、定价体系、核算体系、分配体系和跨境体系,就是谋求理论创新体系化的一大贡献。同时,所论七大体系之间以及各体系内各节之间,都在内容上既有明确界定,又显示相互关联;既有利于研究和实践工作者专注重点领域重点专业发展,又有利于主管部门在基本制度建设及总体政策设计时统筹及统一各方面内在逻辑关系。 当然,无论国内国际,对于数据要素市场都有许多待解问题,希望本专著作者们还要继续“论”下去。就我而言,也一直在寻求对一些问题的答疑解惑。比如,数据要素纳入生产和收入分配体系是必然趋势,这就必须厘清数据资源要素化、资产化和资本化的内涵与外延以及紧密关联的权责利关系,理论上搞清楚十分重要。 又如,数据这一新型要素的复用性极强,特别是可通过交易来持续增加使用价值实现场景和价值,这正是数据资源纳入要素的核心和魅力。但现在全国数十个数据交易场都采取的挂牌或协议交易方式,是无法实现数据要素市场化配置本质要求的,应认真讨论是否需要建立具有金融属性的数据要素资本市场?路径是什么? 再如,数据流通交易过程中,我认为最难的问题不是数据保护,而是数据权益界定(包括再交易过程)基础上形成市场定价体系,可否研究实施利用成熟技术手段(如区块链和数据资产图谱体系)来建立合规合法合理的价格形成机制?(本文来源于人民出版社出版的《论数据要素市场》。本文作者系国家信息中心原党委书记、常务副主任。)

    发布时间: 2023-07-11

  • 80. 探索 Web of Science、Scopus 和 Dimensions 中的出版物元数据字段:科学计量分析的可能性与便利性
    程冰
    摘要:近几十年来,大量研究论文的发表推动了学术数据库的创建,用于索引出版物和记录引用。学术数据库中的出版物元数据字段现在被用于各种目的,从信息搜索和检索到研究评估。传统上,WOS和Scopus一直是主要使用的数据库来源。然而,随着Dimensions等新数据库的创建,选择范围进一步扩大。以前许多研究都比较过主要数据库的覆盖范围和引文数据。然而,目前尚无关于学术数据库提供的元数据字段及其对文献计量研究影响的比较研究。本文试图通过比较从三个主要学术数据库——WOS、Scopus和Dimensions——基于用户界面(UI)搜索下载数据中包含的元数据字段来弥合这一研究空白。探讨了数据库中元数据字段的存在或缺失对文献计量分析的可能性和易用性的影响。研究结果对文献计量研究人员、实践者和数据库管理者具有重要意义。 关键字:维度、元数据、学术数据库、科学计量学、Scopus、Web of Science(WOS) Singh, P., Singh, V. K., & Kanaujia, A. (2024). Exploring the Publication Metadata Fields in Web of Science, Scopus and Dimensions: Possibilities and Ease of doing Scientometric Analysis. Journal of Scientometric Research, 13(3), 715–731. https://doi.org/10.5530/jscires.20041144

    发布时间: 2025-07-23

  • 81. 从 ChatGPT 看生成式 AI 对情报学研究与实践的影响
    闫亚飞
    一般地,情报学理论范式指导情报实践工作。有研究将情报学理论范式分为 4 种,并阐释了每种范式下的情报工作重点和发展趋向,分别是:泛信息论范式下的知识管理与综合性知识服务;学术信息服务范式下的信息检索与服务;决策情报服务范式下的战略情报支持;社会信息服务范式下的企业 竞争情报、社会情报、舆情传播等。鉴于这4种范式较为全面地覆盖了情报实践工作的内容,因此本文将以此为视角,分析生成式AI将对情报实践产生的影响。 1.  拓宽知识资源建设渠道,打造知识服务新生态 知识服务是各类情报机构的一项重要职能,而智慧型知识服务是人工智能时代的产物。生成式AI又将推进智慧型知识服务向高级阶段的进化。从知识生产层面,传统的知识资源多出自出版社、数据库商以及情报机构的自建数据库和知识库。生成式AI的出现将拓宽情报机构知识资源建设的渠 道,AI辅助用户内容创作、AI自动生成内容成为 新的知识生产模式。一方面,每个用户可参与到知 识生产过程中,通过AI辅助获取知识创作的灵感、素材,由AI生成文本、图像、代码、3D模型等多模态知识,实现内容续写、跨模态内容生成( 文字 合成图片或视频等),可极大提升用户体验;另一 面,生成式AI能够通过学习数据的底层模式再自动生成新内容。但就目前最先进的生成式AI技术ChatGPT而言,一大特点就是无法保证生成内容的准确性,这与知识的属性相斥。近期发表在Nature上的文章《ChatGPT:五大优先研究问题》中,研究者指出,ChatGPT 被用于科学界,必须要 坚持人类审查的原则。这无疑对情报机构提出 了新的挑战,即缺少前端的专家审核,情报机构需要承担对AI生成知识内容的人工审核与质量把控 的任务。从知识服务层面,随着元宇宙概念的提 出,情报服务机构致力于构建结合 AR、VR、人工智能等技术的超现实空间与现实空间融合的虚实共生的知识服务场景,而生成式 AI 技术也将为此贡献巨大力量,比如利用AIGC生成虚拟人或数字人,利用“ChatGPT+虚拟人”技术打造人机交互新入口,为用户提供沉浸式、立体化知识体验,有助于拓宽情报机构知识服务的范畴,构建知识服务新生态。 2.  塑造学术信息检索新范式,优化学术信息服务模式 ChatGPT的出现对搜索引擎业务构成了较大威胁,但百度指出生成式AI并不能替代搜索引擎,两者是一种互补的关系,并提出了融合两者功能的“生成式搜索”概念,这对情报领域的学术信息搜索发出了信号。一方面,针对以 Web of Science、中国知网、情报机构自建知识库等为代表的学术信息搜索平台,如果借鉴ChatGPT与WebGPT的联动效应,将生成式AI整合至学术搜索平台中,使其实时根据数据库内容更新,生成的内容参考了某篇学术论文则注明其来源。用户关于某一研究主题 得到的检索结果将不仅是文献列表,也能呈现由生成式AI筛选、整合、总结生成的文献综述,又或是根据读者描述的研究思路,基于对海量文献中图表、图像数据的学习,生成技术路线图以供参考,甚至是针对某领域的研究成果,利用生成式AI抽取细粒度知识,自动生成学术知识图谱,把复杂的关 联研究直观地呈现给读者,以交互式问答方式回答读者的问题,并通过连续对话提升读者体验;另一方面,对于学术科研互动社区,生成式AI在学习了 科研用户海量的问答数据之后,可针对用户搜索或提问生成答案。由此可以预测,生成式 AI 将会重塑 学术信息检索新范式,有助于优化信息服务模式, 但其能力边界与训练时被投喂的数据数量、质量、丰富度有很大关系,这将是情报实践工作中着重考 虑的问题。此外,最重要的是,基于 AI 的学术信息 服务需在明确的使用规范前提下开展,避免被错误和虚假信息误导而产生学术不端等后果,这一问题 正是当前学术圈讨论的热点。 3.  挑战决策情报服务体系,驱动情报效能提升 决策支持服务是情报工作的一项重要内容,主要面向国家科技战略、产业发展与产业结构政策、学科发展等战略决策型关键问题,通过文本挖掘、科学计量等方法深度剖析科技发展态势、学科演化、政策布局,形成战略咨询报告。ChatGPT 发布 以后,被尝试用于生成行业分析报告、市场调研报 告等。其使用了来自人类反馈的强化学习方案,具备良好的思维链能力,能够针对特定问题自主生成解决方案。虽然从目前来看,生成的报告内容仍然 不够专业可信,并不能直接用于指导决策,但随着不断地反馈学习以及模型算法的优化,性能会极大地提升。这对面向决策支持的情报服务产生了较大的冲击和挑战,然而并不会完全取代情报人员的工作,而是作为辅助工具加速推进决策支持服务的智能化,驱动情报效能的提升。因为,即便是在Zero-shot设置下执行下游任务,也需要向AI输入提示。换言之,在决策支持服务中,最基本也是最重 要的环节是情报分析对象、方向、预期的情报产物 形式与内容(比如战略报告的框架)的确定,生成 式AI仅作为辅助情报分析与内容生成的工具,前提是情报人员向其输入合适的问题,这意味着情报人员需要对用户需求有深刻的理解并承担情报产品 的设计工作。从另一方面来看,生成式AI有助于将情报人员从琐碎的分析、撰写任务中解放出来,更多地投入创新性研究工作中。比如,在利用科学计量学分析方法辅助制定科技发展战略规划时,AI可以依据已有的理论和方法,针对特定问题基于数据挖掘生成分析报告,但探索计量学新理论、新律,具体到更加科学有效的新的指标体系构建等创造性工作中,仍然需要专业人员的深入研究和持续创新。 4.  增加社会信息服务压力,凸显情报价值引领 在社会信息服务范式下,情报工作在企业竞争情报服务、安全情报服务、舆情风险预警与治理、数据治理等领域发挥着重要作用。生成式AI在赋能情报收集、处理与分析的同时,也会带来一系列负面影响,增加情报服务的压力。比如,在社会安全和舆情治理方面,ChatGPT可能会成为谣言制造者或舆论引导者的辅助工具,在一些误导性、充斥阴谋论的提问下大量改编信息,引导社会舆论向片 面、极端的方向发展。这在一定程度上会加大风险的情报感知与情报预警的难度。在数据治理方面,近年来关于科研大数据治理、企业大数据治理、政府大数据治理等问题愈发重要,治理的维度涉及数据安全、数据标准、数据质量等。伴随着 ChatGPT等生成式AI的快速发展,海量AI生成数据涌向经济、科研、政务等各个领域,由此带来的数据治理 压力是巨大的。从生成式AI模型的工作原理来看,生成数据的质量取决于训练时被投喂的数据质量和输入提示的有效性。因此,数据治理不仅涉及到AI创造的内容,同样涉及训练数据和提示数据。可以预见,情报学在数据治理领域将面临较大挑战,具体包括AI生成数据的质量管理、标准化、数据归类、数据产权归属等各类问题。然而,从另一个角度来看,生成式AI在增加社会情报服务压力的同时,也更加凸显情报的价值和社会效用,如 何充分发挥情报在综合研判、监测预警、信息汇聚 与治理等方面的作用,更好地服务社会发展,是情报工作在AI冲击下保持优势地位的关键。

    发布时间: 2023-07-11

  • 82. 全球开放获取转换实践及其对我国高校图书馆的启示
    杨小芳
    [目的/意义]  高校在全球开放获取转换进程中扮演着重要角色,开展我国内地高校图书馆开放获取转换实践及其影响研究,对于完善学术公共资金支出政策、提高公共利益参与博弈和制衡能力、参与国际开放获取出版规则的制定、构建良好学术信息生态等具有重要的参考价值和战略意义。 [方法/过程]  从开放获取转换背景和ESAC登记转换协议入手,分析ESAC登记转换协议总体情况、重要转换机构和重要出版社分布、主要转换类型等,通过网络调查、在线问卷、电话访谈等方式开展我国内地高校图书馆开展开放获取转换实践及其影响调查。 [结果/结论]  受经济发展水平、购买力等因素影响,数据库订阅价格在不同国家和地区存在一定差异,然而目前全球差异化的开放获取出版费用体系尚未形成。如何调整折扣和豁免计划,以使作者能够更公平地获得开放获取出版权益,是现有开放获取出版模式可持续发展的关键所在。因此,深入开展开放获取相关知识的宣传与普及,争取科研管理部门和科研人员对开放获取出版及转换的支持,持续关注国内外转换进展,向已实施开放获取转换的机构开展调查,结合我国国情开展转换路径、应对策略等理论和实证研究,是我国高校图书馆推动开放获取进程的有效途径。

    发布时间: 2023-12-01

  • 83. 我国图书情报领域新兴交叉学科发展探析
    黄雨馨
    我国图书情报领域新兴交叉学科发展探析 马费成,张帅 新兴交叉学科正在成为我国科技创新的重要驱动力,并不断催生新的学科生长点和新的科学前沿。本文以当代我国图书情报学科研究中的新兴交叉学科为对象,运用案例分析与比较分析方法,解析我国图书情报领域新兴交叉学科的发展特点与演进模式,探讨我国图书情报领域新兴交叉学科的理论建构。我国图书情报领域新兴交叉学科的发展依赖于“创新驱动、应用引领、技术赋能”,形成了从“问题域—方法论式单向引进”到“方法论—问题域式反向输出”再到“问题域—问题域式双向合作”的演进模式。以此为基础,建构了理论发展与范式革新并重的新兴交叉学科理论模型,为当代我国图书情报领域的新兴交叉学科体系建设提供有益借鉴,为新时代中国特色图书情报学科的创新发展提供有益参考。

    发布时间: 2023-10-10

  • 84. 基于图文数据的Bilibili社交平台健康信息主题态势演化分析
    程冰
    [目的/意义] 深入探究公众在社交平台上反映的日常生活中的各类基础、综合性健康问题及健康矛盾,同时聚焦社交平台上不同健康信息主题的发展演变态势。[方法/过程] 首先,对社交平台上健康信息的图文数据进行转化,利用BERTopic主题模型构建主题文档;其次,在主题文档中嵌入时间节点,识别健康信息主题的演化发展;最后,预测未来健康信息主题的发展态势。[结果/结论] 为健康信息领域动态发展的研究提供参考,有利于公众建立健全的健康认知体系,并向其普及健康知识,引导公众建立正确的健康观。

    发布时间: 2025-07-22

  • 85. 从书架到头条:探索图书馆作为地方新闻孵化器和合作者的案例分析
    程冰
    2026年6月11日,Public Library Quarterly发表一篇文章,提出了图书馆信息服务的新思路。美国各地 “新闻荒漠”(缺乏本地新闻源的社区)数量日益增多。本研究聚焦图书馆与社区的合作模式,尝试整合地方新闻业与图书馆学两个关联领域的信息框架,探索满足社区信息需求的路径。通过分析既往将图书馆作为本地新闻生产阵地的项目案例,这项探索性研究发现,在缺乏本地新闻基础设施的地区,公共图书馆可发挥多重潜在作用,有效填补关键信息缺口。

    发布时间: 2025-07-23

  • 86. 欧盟经济与社会委员会报告称欧洲生成式AI发展整体呈劣势,而教育或可成为有力增长点
    彭笑菊
        2025年3月,欧盟经济与社会委员会(European Economic and Social Committee)发布《生成式人工智能与基础模型》报告。该报告详细阐述了生成式人工智能价值链,明确了主要参与者和投资趋势,并揭示出美国的主导地位。报告还探讨了生成式人工智能在欧盟教育等多个领域的应用,突出了其中的机遇与挑战。     报告指出,生成式人工智能的迅猛发展正在重塑行业格局,它的快速应用将直接影响技术研发路径、监管框架设计和跨行业联结。目前,生成式人工智能正面临严重的结构性市场失衡。美国企业在整个人工智能价值链上占有全球80%以上的融资份额,呈全面主导态势;同时,中国实现突破性进展,推出可与OpenAI抗衡的DeepSeek R1模型,发展势头强劲。而欧盟实体在竞争中举步维艰,这种差距不仅导致市场多样性降低,更直接挑战欧洲的相关技术主权。     基于利用现有优势并应对现实关键挑战的战略考虑,报告建议将汽车、清洁能源和教育作为欧盟在全球竞争中争取有利地位的突破口。教育之所以作为欧盟可以利用生成式人工智能促进创新的三个战略领域之一,是因为具备以下主要优势:首先,欧盟早在2021年开始行动,成立专家组来标准化AI生成的教育内容和质量标准,确保生成式人工智能在教育环境中的可靠性和有效性;其次,生成式人工智能用于自动化批改作业,生成学生表现评价和回复重复性咨询,给教师创造更加专注于教学设计与个性化指导学生的空间,从而改进学生学习的参与度,有效激发求知动机,并改善学业表现;第三,欧盟早在《欧盟AI法案》中将教育相关AI归类为“高风险”领域,因此及时构建了教育工作者与政策制定者的协作框架,共同促进建立创新与安全并重的保障机制。这种制度设计不仅推动规范可信的AI发展,又为教育场景的特殊需求提供了关键保障;第四,欧盟每年约投入10亿欧元用于发展AI所必须的科研基础设施,致力于开发安全合规的AI应用,推动“AI made in Europe”从实验室走向市场。     生成式AI为提升教育体验提供了多重机遇,主要表现在: 1.    个性化学习。生成式AI通过分析学生表现与偏好提供个性化的学习内容和路径,这种动态适应的教学模式通过调节教学节奏与风格,有效提升学习参与度和成效; 2.    内容创建。生成式人工智能可根据不断更新的信息生成时效性强的个性化教案,协助教育工作者高效生成教学材料,提供新鲜且精准匹配学生个体需求的教学内容; 3.    师资培训。研究发现,大学教师对生成式人工智能的认知与学生合乎伦理地使用AI呈正相关。因此,为了能够为学生提供正确引导,大学教师须通过使用AI深入领会其潜在效益和局限,并采取理性负责的AI应用策略来影响学生。     同时,生成式人工智能融入教育方面也面临一些挑战: 1.    涉及学术剽窃及科研诚信的AI使用伦理。由于AI生成内容唾手可得,学生作业能力受到严峻考验,亟需建立有效机制识别利用AI作弊,从而减少学生因过度依赖AI,而产生的批判性思维减弱,解决问题能力不足和创造力下降等削弱核心素养发展的状况; 2.    必须提供有效的技术培训,以使学校教师、管理人员,及学生、家长顺利适应AI变革。为促进相关利益者交流经验与策略,推动良性适应生成式人工智能,建立紧密的实践社群与合作平台或成为关键举措; 3.    教育工作者的角色可能因生成式AI的影响而巨变。生成式AI的融合应用,必须以辅助和强化教师专业能力为前提,而非取而代之。     结合机遇与挑战,该报告就欧盟推进生成式人工智能在教育中的应用提出以下建议: 1.    欧盟应率先制定教育领域人工智能应用监管指南,从安全性、透明度和伦理使用等维度,在保障创新的同时,明确标准,助力教育机构与开发者化解AI整合难题,杜绝技术滥用与偏见; 2.    教育机构需完善AI教学应用政策,通过专业发展计划与培训赋能教育工作者,使其熟练运用AI工具;同时制定契合欧盟法规的内部准则,严守伦理规范,推动AI在教学中的负责任应用; 3.    持续深入研究生成式AI对教育的影响,是明晰其利弊的关键。要充分释放技术潜能,需构建政府、教育机构与私营部门的协作体系,通过协同创新优化教育AI工具,保障技术资源在各地区、各社会经济群体间的公平分配。     教育是欧盟在生成式人工智能领域取得发展优势的重要领域。报告通过对现状和发展愿景的阐释,指出生成式人工智能对欧盟教育的影响,和其融入教育面临的机遇和挑战。报告在技术现状和监管意义等方面的剖析,是欧盟教育领域发展生成式人工智能的有益探讨。

    发布时间: 2025-07-23

  • 87. 文献耦合与概念相似性:文献耦合的论文在概念上也相似吗?
    程冰
    摘要:多年来,文献耦合在科技文献相关的不同语境中被提及和使用。学者普遍认为,具有文献耦合的研究论文涉及相似的概念,因此它们之间可能存在较高的概念相似性。本本试图对这一观点进行实证评估研究。本研究基于Dimensions数据库获得的数据,采用先进的机器学习算法提取加权关键词,捕捉文献的概念内容。的文献耦合矩阵和概念耦合矩阵。结果表明,尽管文献耦合被广泛用于评估研究论文之间的关系,但它往往无法识别文献中的实际概念相似性。本研究的结果对信息检索、跨学科研究和评价指标等领域具有重要意义,呼吁更精细地理解研究文献之间除了共享参考文献之外的关系。 关键字:文献耦合,概念耦合,概念相似性,语义相似性 Nandy, A., Singh, A., Gupta, V., & Singh, V. K. (2024). Bibliographic Coupling and Conceptual Similarity: Are the Bibliographically Coupled Papers also Conceptually Similar? Journal of Scientometric Research, 13(3), 706–714. https://doi.org/10.5530/jscires.20041115

    发布时间: 2025-07-23

  • 88. 生物安全灰色文献的获取、翻译与传播
    程冰
    摘要:生物安全研究专注于入侵物种,生物安全研究的传播受到三个主要问题的阻碍。首先,生物安全研究并不总是被发表,且获取起来可能比较困难。其次,生物安全参与者以不同的方式提出问题,参与者和研究文献之间的术语差异较大。第三,由于获取和翻译问题,识别研究文献中的重叠和空白变得困难。生物安全风险分析卓越中心(CEBRA)正在通过开发生物安全风险研究门户(Portal)来解决这些问题。在本文中,我们讨论了一个系统,该系统提取和转换开放获取的灰色文献研究,以满足特定领域的信息需求。我们讨论了支持元数据提取的新受控词汇。我们展示了如何共同开发受控词汇和存储库服务,以确保及时满足从业者的信息需求。该门户连接了包括政府、行业和研究机构在内的元数据来源,提供开放获取的全文。我们描述了功能模块,包括元数据提取、元数据协调、标记和将元数据转换为适合分析应用的图形数据。我们介绍了受控词表,包括生物安全词表。我们讨论了新词表的输入来源,如语料库分析、调查数据和生物安全框架。 关键词:生物安全,灰色文献,开放获取,语料库语言学,图数据库,受控词表 Kneebone, L., Hester, S. M., Baumgartner, J., Sun, H., & Robinson, A. (2024). Outbreak! Containing, Translating and Transmitting Biosecurity Grey Literature. Journal of the Australian Library and Information Association, 73(4), 541–555. https://doi.org/10.1080/24750158.2024.2411643

    发布时间: 2025-07-23

  • 89. 中科大江俊团队自主研发Chem-GPT,改变传统化学研究范式,解放化学家双手
    黄雨馨
    近日,中国科学技术大学化学与材料科学学院江俊团队自主研发 Chem-GPT——一款化学领域的聊天机器人程序。 Chem-GPT 由化学数据驱动,并结合人类化学家的知识进行机器学习训练,能够针对使用者提出的问题,给出初步的实验建议。基于开源的 GPT 代码,目前阅读了 50 万化学论文,可以基于论文知识来回答化学问题、建议实验方案,驱动机器化学家「小来」做实验,解决化学品和新材料的研发问题。 Chem-GPT 通过阅读 50 万篇化学论文,响应使用者提出的化学问题。 1. 大胆假设:基于文献数据,给出初步实验建议; 2. 小心求证:驱动机器化学家「小来」做实验与模拟; 3. 精准预测:针对实验与理论数据归纳总结; 4. 解决问题反馈优化方案驱动实验验证。,时长02:33以芬顿催化剂为例Fenton(芬顿)是众多的以人名命名的无机化学反应之一。 芬顿反应是一种无机化学反应,过程是过氧化氢(H2O2) 与二价铁离子 Fe2+ 的混合溶液将很多已知的有机化合物如羧酸、醇、酯类氧化为无机态。反应具有去除难降解有机污染物的高能力,在印染废水、含油废水、含酚废水、焦化废水、含硝基苯废水、二苯胺废水等废水处理中有很广泛的应用。 芬顿催化剂又叫芬顿催化氧化填料,芬顿填料,它在传统芬顿反应的基础上,将芬顿反应所需的铁氧化物通过特殊方法附着在载体表面,形成有效的芬顿催化剂。 问:什么类型的非贵金属元素常用于芬顿催化剂? Chem-GPT 的结果其实就来自于江俊团队开发的化学文献机器阅读系统,该系统内置了自然语言处理模型,通过阅读数千篇芬顿催化剂相关文献,可以很快统计出文献中出现频次最多的非贵金属元素。 化学文献机器阅读系统。文献中出现频次最多的非贵金属元素。除了对数量进行统计,该系统还能进行元素协同分析来帮助我们选择最佳的元素组合。 最佳的元素组合。 Chem-GPT 能从文献的精确分析中学习到正确的知识,并不是仅仅基于语言的关联性,因此它给出的答案保证了严谨与准确性。 接下来,就可以调出机器化学家操作系统中保存的芬顿催化剂实验模板,并根据 Chem-GPT 推荐的元素组合编辑液体进样站的参数,让机器获取家小来帮助我们进行实验验证。 就这样,小来开始了愉快的芬顿催化剂创制之旅。化学文献机器阅读系统化学文献机器阅读系统基于 Word2Vec 与机器学习算法,结合语法距离分析方法,根据关键词,从文献中抽取化学关系,包括 Alloy 和 Organic molecule 两种任务。程序使用说明如下: 1. 数据准备:目前系统支持两种格式数据:一是 TSV 文件格式,需要从 Web of Science 网站上下载,方法如下:进入 Web of Science 网站,根据关键词检索文献后,以制表符分隔符的形式导出,具体步骤见下图所示。 二是 PDF 格式文件格式,支持任意 PDF 格式论文。 2. 数据准备完成后,点击页面新建任务按钮,进入新建任务页面; 3. 在新建任务页中填写任务名称、抽取的分子类型、上传准备的数据、填写关键词信息,其中点击可添加多个关键字; 当抽取的任务类型为 ALLOY 时,需指定目标元素在元素周期表上的周期,当需抽取的任务类型为有机分子, 则无需选择。 4. 填写完成后,提交任务,等待任务排队完成,即可获取最终化学关系抽取结果。机器化学家2021 年 6 月,在 2021 北京智源大会《科学智能》专题论坛上。中国科学技术大学化学物理系江俊教授作了题为「分子光谱与材料构效关系的机器学习研究」的演讲。 江俊表示:「上个月,中国科学技术大学研究人员提出「机器化学家」这个概念。我从鄂维南院士提出的『AI for Science——从理论模型得到可靠的数据,再从数据得到有效的模型』得到了启示,修改了我之前的思路,并拿到了项目。」「机器化学家」将帮助人类科学家突破思维局限,从融合了底层规则的数据中,学习建立有效的复杂模型,指导化学实践。 就在项目启动一年后,在中国科学院「数据驱动的化学、材料和生物科学的机器科学家」青年团队计划和国家自然科学基金委项目的资助下,江俊教授团队通过开发和集成移动机器人、化学工作站、智能操作系统、科学数据库,研制出数据智能驱动的全流程机器化学家。,时长02:02这个神奇的「机器化学家」是全球首个数据智能驱动的全流程机器化学家平台。 当然,「机器化学家」并只是一年就可以完成的,这是中国科学技术大学化学与材料科学学院教授罗毅、江俊团队经过八年攻关研制出的。 相关研究成果以「An all-round AI-Chemist with a scientific mind」为题,于 2022 年 9 月发表在《国家科学评论》(Natl.Sci.Rev.)上。 论文链接:https://academic.oup.com/nsr/article/9/10/nwac190/6694008「机器化学家」由「化学大脑」、机器人实验员和智能化学工作站三部分组成。其中最核心的「化学大脑」通过分析大量化学实验和理论数据建立知识图谱,实现了阅读理解文献、设计化学实验、自主优化方案的能力,并配备了人机交互的操作系统,可以便于「无编程基础」的科研用户使用。机器人实验员和 16 个化学工作站之间能进行数据交换和互动,精准配合执行化学实验。 业内专家认为,机器化学家的研究工作脱离了传统试错研究范式的限制,展现出「最强化学大脑」指导的智能新范式的巨大优势,引领化学研究朝着知识理解数字化、实验操作指令化、材料创制模板化的未来趋势前进,确立了我国在智能化学创新领域的全球领跑地位。 全球首个数据智能驱动的全流程机器化学家。就在本月,江俊团队首次将数据驱动自动合成、机器人辅助可控合成、机器学习促进逆向设计,用于胶体纳米晶(例如钙钛矿)材料合成,探索构建了「机器科学家」平台,有望将科研人员从传统试错实验、劳动密集型表征中解放,聚焦科学创新,实现纳米晶材料数字智造。 该研究以「A robotic platform for the synthesis of colloidal nanocrystals」为题,于 2023 年 3 月 2 日发布在《自然-合成》(Nature Synthesis)上。 论文链接:https://www.nature.com/articles/s44160-023-00250-5「这主要得益于中国科大多学科交叉的背景,促使不同学科的科研人员汇集在一起共同做一件事。我们的目标是建成机器化学家大科学装置,解放化学家双手,加快新的化学品和新的材料研发创制。」江俊教授说。 未来蓝图:改变传统化学研究范式,解放化学家双手 对于未来,江俊教授希望他们可以建成一个「机器化学家」大科学装置:在一整栋大楼里,布置上百个机器人、上千个智能化学工作站。一边,全国的化学家、材料学家只需在网上提交自己的任务;另一边,团队成员通过智能操作系统分时安排机器人完成任务,最后将方案反馈给化学家们。 基于这样一个大平台,各个课题组的实验数据可以交汇、共享,产生海量数据,实现自动提炼出数字化的知识图谱和人工智能的模型,进而指导机器人自动优化产生更好、更高效率的化学品或新材料。而且在完成各个实验过程中,机器人通过与科研人员互动,默默学习人类的操作逻辑、思维模式,很有可能在若干年之后,机器人会变成一个智能、创造力都比肩大学教授的机器化学家。 「我们希望争取到国家的支持,在 2 至 3 年内建成拥有几十台机器人的小型装置,3 至 5 年后建成一个大科学装置。在这期间,我们还需要不断训练机器人和智能化学通用模型。」江俊教授规划着未来的研究蓝图。他们最终目标是改变传统化学研究范式,解放化学家双手。

    发布时间: 2023-07-11

  • 90. 认知与实践:AI技术在高校图书馆应用现状调研分析
    杨小芳
    研究目的 本文旨在通过系统性、综合性的调查分析,准确把握人工智能(AI)技术在当下高校图书馆的应用现状,揭示图书馆从业者对AI技术的认知情况以及AI技术在图书馆的实践应用情况。在此基础上,进一步分析AI技术在图书馆发展中面临的制约因素,从领导建筑层、馆员实践层和校内外合作补充层三个层面提出推进AI技术在高校图书馆应用的可行建议,以促进AI技术在高校图书馆的高质量发展。 研究创新 综合性调研:本文采用文献调研、网络调研和问卷调查相结合的方法,全面覆盖了高校图书馆及技术厂商的视角,弥补了以往研究中数据来源单一、调查面窄的不足。 多维度分析:从图书馆领导者、馆员和校内外合作三个层面提出实践建议,为AI技术在高校图书馆的应用提供了多维度的解决方案。 实证研究:通过大规模的问卷调查,直接获取了图书馆员和技术厂商的反馈,为研究提供了丰富的数据支持。 研究方法 文献调研:通过查阅国内外相关文献,了解AI技术在图书馆应用的研究现状和不足。 网络调研:通过网络渠道收集高校图书馆和技术厂商的AI技术应用案例和数据。 问卷调查:设计并发放问卷,收集全国范围内高校图书馆员和技术厂商对AI技术的认知、应用现状及面临的问题。问卷包括受访者基本信息、对AI技术的观点认知、AI技术应用及推广情况等内容。 研究结果 AI技术的应用现状:AI技术在高校图书馆的应用已取得一定进展,尤其在智能馆员助手、智能读者服务、智能知识组织和智能馆舍空间等方面表现出显著潜力。 主要问题:资金短缺、技术局限和馆员能力不足是制约AI技术在高校图书馆广泛应用的主要障碍。 馆员认知与能力:大多数图书馆员对AI技术在高校图书馆的发展前景持积极态度,但AI素养普遍有待提升,尤其在AI工具操作、智能问答和数据管理等方面的技能需求较大。 校内外合作:高校图书馆与信息技术部门、教学管理部门和科研管理部门的合作是推动AI技术应用的重要途径。 实践建议:从加强校内外合作、激活馆员能动性、提升馆领导能力三个方面提出了促进AI技术在高校图书馆发展的实践建议。 结论 本文通过系统性、综合性的调查分析,揭示了AI技术在高校图书馆的应用现状及面临的问题,并提出了多维度的实践建议,为推动AI技术在高校图书馆的高质量发展提供了理论支持和实践指导。

    发布时间: 2025-07-23

  • 91. 数智时代的人工智能素养:内涵、框架与实施路径
    饶海侠
    在数字化和智能化以及人工智能(AI)快速发展的背景下,技术的进步不仅改变了我们的日常生活和工作方式,也对教育领域,特别是高等教育中的素养教育提出了新的挑战和要求。2024年2月20日,蔡迎春等在《中国图书馆学报》期刊上发表《数智时代的人工智能素养:内涵、框架与实施路径》一文。文章梳理了AI素养的内涵、框架和实施路径,提出高校图书馆应积极参与AI素养教育。通过引入KSAVE模型,构建涵盖知识、技能、态度、伦理、价值观五个领域的AI素养框架,并建议高校图书馆从跨学科知识体系构建、能力构建与实践应用、道德觉醒与责任担当三个方面开展AI素养教育,培养具有批判性思维和责任感的AI素养人才。 研究内容 文章聚焦于人工智能(AI)素养的内涵、框架以及实施路径。 1.文章探讨了AI素养的概念,认为它不仅是对AI技术的理解和应用,更是一种全面的、与时俱进的技能和知识体系,强调了AI素养在数字化和智能化背景下的重要性。接着,文章通过引入KSAVE模型,构建了AI素养的框架,该框架包括知识(Knowledge)、技能(Skill)、态度(Attitude)、伦理(Ethics)和价值观(Values)五个关键领域,这一框架为全面理解AI素养提供了理论基础。 2.文章重点分析了高校图书馆在AI素养教育中的角色和实施路径。作为长期从事素养教育的核心机构,高校图书馆被赋予了推动时代素养发展的重要使命。文章提出了高校图书馆应从跨学科知识体系构建、能力构建与实践应用、道德觉醒与责任担当三个方面开展AI素养教育,以培养适应数智时代的新型人才。 3.总结部分叙述了AI素养教育的挑战和前景,强调了高校图书馆在推动AI素养教育中的关键作用,并对未来的发展趋势进行了展望。 研究结论 1.指出人工智能素养不仅包括对AI技术的理解和应用能力,还涉及到伦理观念、价值取向以及社会责任感等多维度内容,这一结论强调了人工智能素养教育的全面性和深度,不仅要求个体掌握技术知识,还要注重伦理、价值和社会参与的培养。 2.提出了一个全面的人工智能素养框架,该框架包括知识维度、技能维度和态度、价值观和伦理维度,这一框架为人工智能素养教育提供了指导和参考,帮助教育者明确教育目标和内容,同时也为学习者提供了一个清晰的学习路径。 3.文章最后强调了高校图书馆在人工智能素养教育中的关键作用。作为知识的宝库和传播枢纽,图书馆不仅提供与AI相关的资源,还承担着推动跨学科知识整合和培养创新思维的重要任务。文章提出图书馆需要积极应对AI技术与多学科知识的融合,设计创新教育课程,并引导学生适应AI技术带来的社会变革。

    发布时间: 2024-10-31

  • 92. 情报智能体——面向“十五五”的科技情报工作新范式
    程冰
    0引言 未来发展选择可以从过去的历史中找寻演变逻辑与灵感。纵观情报学发展历程和变革驱动因素可知,其格局的变化通常是由新信息技术的采纳和旧信息技术的淘汰所驱动的。2024年以来,GPT-4o、LLaMA等大模型(Large Language Models,LLMs)以远超人类能力进化的速度和规模分析处理大量数据,具备了达到与人类相当水平的推理和规划能力的潜力。人工智能(Artificial Intelligence,AI)即将成为“执行科学发现的自主研究人员”。 作为当前最先进的AI技术之一,大模型和Agent一直以来被认为是实现通用人工智能(Artificial General Intelligence,AGI)的关键技术,融合了大模型的智能体更是呈现出自主性、具身性和互联性等关键特征,能够承担许多由人类执行的分析、创造和决策职责,提高了广泛情境中的复杂交互和认知决策。将融合大模型的Agent应用于解决科学问题,即科学智能体,正在以革命性的方式改变和颠覆几乎所有科学领域的知识发现模式。对时代的认识不能犯错误,错过时代转变机遇将遭受历史性的降维打击,文献情报工作亟待采纳智能体。 未来的发展路线都是建立在已有知识的基础之上,不同时代背景下的发展理念和技术生产力水平,塑造出文献情报工作鲜明的阶段特征。正确判断并合理选择文献情报工作未来的发展道路,需要全局掌握其来时路、清醒认知脚下路。本文通过梳理总结中国及中国科学院文献情报工作的阶段特征、剖析变革驱动要素,揭示科技情报工作发展转型的核心驱动力量。以AI为立足点,认知其赋能科技情报工作的方式,理解当前AI带来的科技情报工作范式变革,结合前期大量的思考认知积累,分析判断文献情报机构未来的工作模式选择。 1中国科技情报工作的特征和变革驱动要素 1.1 中国科技情报工作发展历程 学者们从情报学研究对象、情报技术、情报服务、情报工作等多个不同视角对中国科技情报工作的发展阶段进行研究划分。从情报工作视角开展的研究,尽管阶段划分之间存在差异,但都认为中国科技情报事业的开端是1956年,即中国科学院科学情报研究所(中国第一个综合性科技情报机构)成立。近70年历程,中国科技情报事业所面临的需求和技术能力都在变迁,科技情报工作的目标定位和发展特点也在逐步变化。中国科技情报工作可以划分为4个阶段:第一阶段是1956至1978年,逐渐建立国家、省、市级的体系化的科技情报机构,主要工作目标是获取国外的科技资料,来支撑中国科技战略规划的制定;第二阶段是1979至1991年,面对科技情报工作现代化问题,发展计算机情报检索技术和系统;第三阶段是1992至2014年,致力于建设电子图书馆、网络图书馆、数字图书馆,使得科技文献和知识广泛流动,以知识服务支撑科技决策,增强政府决策的科学性和战略性;第四阶段是2015年后,科技情报机构开始明确将拓展智库功能作为发展目标(表1)。 表1 中国科技情报工作的发展历程 1.2 中国科学院文献情报工作的发展 中国科学院文献情报系统由院级文献情报中心和研究所所级图书馆组成,采用全院协同的工作模式。中国科学院文献情报工作的开端始于1950年设立的院图书管理处、1956年设立的科学情报研究所、1956年设立的中国科学情报大学,1958年科学情报研究所划转科技部、中国科学情报大学并入中国科学技术大学。1977年中国科学院决定科技情报工作由图书馆承担,不另设科技情报所。中国科学院文献情报中心的发展可以划分为4个阶段:1950—1978年,文献保障服务为主的阶段;1979—2005年,发展信息服务、情报服务的创新阶段;2006—2015年,发展数字服务和知识服务的转型阶段;2016年至今,拓展智能和智库服务的变革阶段(图1)。 图1 中国科学院文献情报工作发展历程 (1)文献保障服务阶段。科技文献服务、图书馆咨询服务(1950—1978年)。从1950年到1978年,中国科学院文献情报中心经历了从无到有的建设,发展成拥有完善服务体系的自然科学图书馆。图书馆服务的主要特征是文献保障,核心能力体现在印本馆藏的建设和参考咨询服务上,建立了一个全面覆盖多学科、多类型、多语言的馆藏体系,编制专题目录、联合目录和文献索引等,构建了较为完整的全国性检索刊物体系,围绕科研和管理需求,开展专题文献、文摘、参考咨询等工作。 (2)信息化发展创新阶段。科技信息与科技情报服务(1979—2005年)。1978年12月,中国科学院文献情报中心确立图书情报一体化体制,率先在图书馆启动计算机应用研发,设立国际联机检索服务终端。2001年组织建设国家科学数字图书馆(CSDL)。数字图书馆主要特征是信息化文献服务和科技信息服务,服务的核心能力,既包含传统的印本馆藏、书目数据库和全文数据库建设,也包括信息服务系统建设,提供个性化的系统门户、虚拟阅览室和网络资源导航,并通过科学计量分析等方式为用户提供服务。 (3)数字化知识服务转型阶段。数字化信息服务与知识服务(2006—2015年)。2006年,中国科学院文献情报系统,按照数字化发展逻辑,提升整体科技情报服务能力,面向一线科研人员开展科技情报研究、信息专报、信息平台与工具建设等工作,文献情报服务从传统图书馆服务向知识服务转化。2006—2015年间中国科学院文献情报工作实施知识服务转型,围绕用科研工作流建设和提供数字化文献情报服务。科技情工作的核心能力是采集数字化文献和网络信息,构建集成检索平台、文献数据库和学科服务网络,提供学科服务、情报服务和集成系统服务,包括情报分析报告、专利分析报告、研发信息平台或工具等。 (4)智能化和智库服务拓展阶段。智能化服务与智库研究(2016年至今)。2015年,国家发布《关于加强中国特色新型智库建设的意见》,中国科技情报机构开始向智库化转型。“十四五”期间,中国科学院文献情报中心建立科技信息大数据体系,发展科技创新知识服务,聚焦科技情报大数据平台,开展数据型文献情报服务。将智能化作为其核心特征,以数据要素、技术要素为重要驱动力,融合文献数据库、学术信息内容、科研信息等多种资源,建立信息集成能力、计量评价工具和情报研究能力,满足用户对于知识服务、态势分析、学术评价等的核心需求。 1.3 驱动中国科技情报工作变革的要素——情报需求与信息技术 中国科技情报工作是伴随适应把握国外科技动态的需求和科技决策服务需求而生,致力于满足不断变化的科技和社会需求,同时,技术发展也不断引领着科技情报工作的变革与突破。纵观中国科技情报工作的发展历程和特征,信息技术发展和应用是主要的演进脉络与驱动要素,智能技术采纳一直是科技情报行业从业人员长期追求的期望,如自动信息采集、机器翻译、多源信息融汇、结构化情报分析等。在需求和技术的双力驱动下(图2),科技情报工作从“对内服务”到“向外服务”,从“现场服务”到“远程服务”,从“文献提供服务”到“情报分析服务”,从“情报分析服务”到“决策情报支撑服务”,从“情报服务”到“智库研究”等,其服务模式和服务内容均已发生巨大变化。中国科学院科技情报工作的长期发展中,采纳信息技术逐步叠加,形成了以信息技术为核心的科技情报布局,满足多层次、多目标的科技情报服务需求。 图2 中国科学院文献情报工作的需求拉动与技术驱动 1.3.1 需求拉动,形成了“文献保障-信息检索-知识服务-智库研究”的多元叠加型情报需求 从情报工作生命周期的视角看,学者一致认为“情报流程始于需求分解、终于情报需求满足,既受决策驱动,又以支持决策为目标”,情报工作的起点是情报需求,基于情报需求的服务场景,情报工作人员以提供政策性的、可选的建议或解决方案为产出目标。情报需求的来源和层次十分多样,可以来自国家战略层面、组织发展层面和个人发展层面等,也可以来源于政府、企业、高校等不同类型的社会主体。20世纪50年代中期,由于中国对国外科技动态和成果的把握不力,直接影响到中国科技和经济的发展。国家对科技情报工作的需求,直接导致了1956年建立综合性的科技情报机构,开始搜集、研究和报道国内外的科技状况和成就,为全国的科学工作服务。随后50年建立了覆盖全国、省、市各个级别的科技情报研究所以及各个行业的情报研究所,基本上形成多层次的科技情报工作系统,保证了科技情报事业发展过程中,为科研创新服务、为经济建设服务、为管理决策服务等需求和目标的落实。1978年,面对国内检索刊物体系受到破坏,急需恢复和进一步发展以支撑科技决策的需求,根据科学技术发展规划,制定了《关于建立健全我国科技文献情报检索刊物体系的方案(草案)》和《1979—1985年全国科技文献检索刊物编译出版规划》,支持中国开始有计划,有组织,有领导地统一建立中国的检索刊物体系。至此,中国科技检索刊物向体系化方向跨出了一大步,开始走向系统建设阶段。2006年,中共中央、国务院召开全国科学技术大会,制定《国家中长期科学和技术发展规划纲要(2006—2020年)》,明确提出了用15年时间把中国建设成为创新型国家的战略目标,并提出发展国家科技创新体系的战略决策。面对国家科研创新的需求,科技情报工作向知识服务的方向演化,建设检索平台和服务网络,为科研一线服务。2015年,在中国特色新型智库建设政策的指示下,中国科技工作进入新发展阶段,也为科技情报工作的发展带来了新的契机。面对管理决策和科研创新需求,中国的科技情报工作发展在延续传统信息服务工作的基础上,拓展以知识组织、知识挖掘为主的智能服务,进一步向人与智能相结合的、以智能计算、智力开发为主的智能服务升华。当前,随着社会对知识和智能服务需求的增加,图书馆和情报机构的工作对象从传统的图书、文献扩展到了数据、信息、知识、情报、思想的全链条,驱动着文献情报工作向更深层次、更广范围、更加智能的方向发展。可以说,科技情报工作应国家科技战略发展的需要而诞生,随着国家科技战略发展和社会经济发展的需要而调整和变革。 1.3.2 技术驱动,形成了“信息检索-大数据集成-数据挖掘分析-情报推断与生成”的替代型模式 科技情报事业的发展受到信息技术和情报技术这两大关键技术动力的推动。科技情报领域始终位于信息技术应用的前沿,情报服务模式的形成和优化在很大程度上会受到信息技术和情报技术发展的影响。信息技术的广泛使用、文献工作的持续标准化、情报存储和分析技术的开发,情报传播平台的建设、信息组织和管理技术的发展,不断推动着情报内容和情报方法的革新,促进服务模式的转变。在信息技术革命的冲击下,科技情报工作经历几大变革,努力创建新型科技情报工作范式。在中国科技情报工作开创初期,科技情报工作以文献为基础,基于科技文献的外部和内部特征,向用户提供检索和利用服务。改革开放后,计算机技术开始出现和应用,中国开始建立论文数据库、专利数据库,打开了联机检索时代的序幕。1994年,中国接入互联网络,网络技术的应用,全面应用数字化技术,形成了以检索技术为核心的情报信息获取,主动推送满足用户需求的“经过加工、提炼与处理之后的情报”。21世纪,云计算、大数据、AI等新一代信息技术快速发展,促使情报工作开始向智能服务转型,情报工作者以智能化手段加工信息、激活知识、运用情报。在互联网新技术和大数据时代的推动下,获取不同来源、不同形式、多个维度的全量数据成为可能,情报研究工作积极探索整合数据分析、智能算法与决策支持等技术,以构建全面利用数据资源并实现智能化的情报服务环境。当前,技术发展带来的影响体现在情报需求分析、数据采集、加工处理和分析挖掘等的方方面面,基于AI的理念,智能化检索等技术为情报用户精准提供情报资源,可视化技术和智能推送技术使情报推送和发布更为便捷。新一代信息技术应用形成了众多的工具、方法、平台等,而新工具与方法应用必然推动图情领域理论范式的演化。2022年11月,美国OpenAI公司发布了生成式AI聊天工具ChatGPT,以人类反馈指导的强化学习算法框架为基础,具有出色的自然语言处理、数据分析、推理推断等能力。以ChatGPT模型为代表的生成式大语言模型技术的出现对各个领域产生了根本性的影响,智能体(AI Agent)已成为AI赋能专业流程的基础形式。以数据驱动为基础的科技情报领域迎来了重要变革,情报智能体将直接影响科技情报领域中的信息组织管理、信息检索查询、情报研究分析、科技监测评估等核心职能和主体业务。 2“十五五”期间中国科技情报工作的战略选择——智能体赋能 生成式AI技术深刻影响几乎所有领域科学研究,正在改变科学研究的过程与模式,科学研究智能体已经展现了巨大的发展潜力。中国科技情报工作已经走过了手工检索工具、计算机检索系统、数字图书馆服务系统、知识集成和知识分析平台等阶段,正朝着知识与情报生成方向迈进。信息技术已经从替代信息采集、信息组织、信息检索,走向替代情报分析、情报生成的情报研究智能化阶段。面向“十五五”时期,中国科技情报工作亟待充分利用大模型等生成式AI技术,搭建情报智能体生态,优化重组已有科技情报工作流程,将智能体与信息采集、信息组织、信息存储、信息检索、信息分析等工作深度融合,以智能体赋能科技情报工作,形成科技情报智能体生态,提升科技情报工作的效率。 2.1 AI赋能科学研究已经改变当代科学研究范式 科学研究的两个中心目标是科学理解和科学发现,形成科学见解和理论的基础是收集、转换和理解数据。近些年来,大数据、AI、高性能计算、混合云等信息技术迅猛发展,为加速数据密集型科学范式下的知识发现创造了条件。尤其是AlphaFold2成功解决了长达50年的蛋白质折叠难题,强有力地证明了AI在解决极具挑战性的科学问题方面拥有巨大潜能。毋庸置疑,AI是数智时代科学研究的利器,充分理解其赋能科学研究的驱动方式不仅必要、而且必需。 理解AI赋能科学研究的驱动方式,首先应该清楚AI的能力特征。根据智能程度和计算特征,业界一般将AI的发展分为4个阶段:计算智能、感知智能、认知智能、自主意识。其中,①计算智能,强调海量数据的存储和高效精准处理,这一阶段为后续发展奠定庞大的数据资源和强劲的计算资源;②感知智能,让机器拥有类人的视觉、听觉和触觉等感官能力,能够识别和理解输入的图像、声音、文字等信息,初步具备与外界交互的能力;③认知智能,这是AI发展的较高阶段,大模型等技术正在加速这一目标的实现速度。让机器具备类人的思考能力,即理解复杂概念、推理分析预测、自主决策行动等能力;④自主意识,则是AI的终极目标,机器真正具有自主意识并产生智慧,目前尚且遥远。 理解AI技术赋能科学研究的驱动方式,还应该清楚现阶段AI能够解决的科学问题边界。科学发现的假设空间是巨大和复杂的,图灵挑战发起人北野宏明将科学探索认知空间表示为图3左侧形式。其中,红色区域表示当前人类已知的科学知识。黄色区域表示基于当前已经积累的知识生成的假设空间,能够根据已有知识对其进行一致性测试和实验验证的人类可发现知识。伴随着假设的复杂性和实验验证的自动化水平,不断扩展假设空间的边界,这就构成了以人为中心的人机协同探索知识区域(蓝色)。当假设空间的范围不断变大,直至超出人类的理解认知能力和现有的知识发现模型,则需要依托借助更智能的工具或发展形成新的科学研究范式(绿色区域,边界无限且不可定义)。为了探索和发现这3个区域的知识,需要使用与之匹配的科学研究模式。 理解AI赋能科学研究的驱动方式,还应该清楚现阶段的科学研究模式。基于本文作者先前的研究结果,数智环境下的科学研究主要遵循3种研究模式:数据驱动知识发现、模型驱动知识发现以及数据与模型协同驱动知识发现,如图3右侧所示。其中,模型驱动知识发现主要是指面对基本科学原理已知的科学问题,变量或维数的增加造成计算复杂度呈指数级增长,AI通过高效解决高维数据计算发现知识。数据驱动知识发现主要是指通过对数据的分析寻找科学规律并解决实际问题,主要用于在缺乏明确原理的场景中解决具体问题。数据与模型协同驱动知识发现则适用于原理模型已有部分探索,但尚有部分并不十分清晰时,可通过原理产生模拟仿真数据,基于数据挖掘出经验性原理,相互协同促进研究发现。 综合以上分析,AI赋能科学研究呈现3种驱动方式:高维数据计算、数据增强和数据理解。高维数据计算在此不作赘述。关于数据增强,当前的AI能够有效解决特征提取、添加语义信息增强数据的多样性和稳健性、合成新数据解决数据系数或保密等问题,核心解决科学研究中的基础数据问题,有效扩展科学研究的边界,提升科学研究的质量。关于数据理解,尤其是GPT-4o、LLaMA等大模型(Large Language Models,LLMs)技术不仅能以远超人类能力的速度和规模处理和分析大量数据,而且呈现出接近人类水平的数据理解、推理和分析能力已日益展现出对自然语言理解的迹象,在达到与人类专家相当水平的推理和规划能力方面展示了显著潜力,未来大模型将在众多认知任务上与人类并驾齐驱,甚至超越人类能力。 图3 AI赋能科学研究的3种驱动方式 2.2 AI赋能科技情报工作的方式 理解情报内涵是认知AI赋能科技情报工作驱动方式的基础前提。情报是激活了、活化了的知识,具有及时性、准确性和针对性特征,是基于客观事实的主观预测。情报是在客观知识的基础上产生的,由于受当事人的认知背景和所处的时代环境等条件约束,情报带有不可否认的主观色彩。情报是通过特定活动产生的知识,具体包括3种知识类型:基本描述类、动态报告类和预测评估类。情报产生的基础不仅有知识,还有信息和数据。基于数据、信息、知识、情报间的逻辑关系学者们构建了Data-Information-Knowledge-Intelligence-Wisdom(DIKIW)模型及Data-Information-Knowledge-Intelligence(DIKI)标准模型。AI不仅能将各种复杂的数据类型(包括人类语言)转换为可互操作的量化语言,而且为复杂高维数据计算提供解决方案,促使情报不仅可以从知识中产生,还可以从海量无序的数据和规范有序的信息中直接产生。数据和智能技术的普及发展,促使DIKI链上各节点间已经从单纯的线性传递关系,扩展至循环迭代关系。科技情报工作需要在充分理解用户需求的基础上,尽可能提升数据、信息和知识等情报基础的客观性。基于AI赋能科学研究的3种方式,结合情报内涵,本文认为AI赋能科技情报工作的驱动方式有两个方面:情报基础建设,即数据生产、信息组织、知识表示,和情报生产,即情报计算,如图4所示。围绕AI赋能情报基础建设,确立了中国科学院文献情报中心“十四五”发展战略目标之一,即构建科技情报智慧数据,倾心打造的数据“收、存、治、管、用”一体化科情数据平台,实现数据生产、信息组织和知识表示等工作流程自动化。受AI认知智能水平限制,之前围绕AI赋能情报计算的过程主要以人为主、AI技术为辅的模式,处于AI赋能科学自动化中的L2层级,仅解决某一环节的自动化。未来,AI赋能科技情报工作将通过情报智能体(Documentation and Information Service Agent,DIS Agent)方式实现,将情报基础建设与情报生成深度融合,有力推动科技情报工作迈向更高水平的自动化与智能化。 图4 DIKI理论与情报类型 3基于情报智能体的科技情报工作新范式 为了进一步认识构建情报智能体的路径,需要厘清情报智能体驱动的科技情报工作新范式、新生态以及构建情报智能体的关键任务与方向。 3.1 人与情报智能体协同的科技情报工作新范式 基于科学自动化和科学智能体的层级划分体系,当前已出现的科学智能体多处于L3层级,即科学家提供问题和初始信息,科学智能体自主调用资源工具完成指定的任务;少部分呈现L4层级水平,即科学家仅提供初始信息,科学智能体自动提出科学假设并探索发现科学规律。结合情报的内涵特征,当前阶段构建的情报智能体主要以L3层级为主,因此在情报智能体赋能科技情报工作过程中,还需要与人类智能合作,如图5所示。其中人类智能,即情报专家,主要负责情报情景感知与解析、情报问题输入和情报监控输出功能。情报智能体主要负责情报情景感知与解析、情报问题理解和计算、情报结果输出和反馈优化功能。当前AI在大量认知任务上尚未完全达成与人类智能同等水平,因此对于情报情境的感知解析能力以及生成情报能力方面还需情报专家的广泛参与,提升情报质量以契合用户需求。相较于传统以人为中心的科技情报工作范式下,情报专家需要花费大量的时间在数据生产、清洗和组织工作中,相关研究表明这些工作占据科学家大约80%的时间,仅有20%的时间用于认知解析等核心活动,人与情报智能体协同的科技情报工作范式下,情报专家可能仅需花费20%的时间评估选择合适的智能体用于数据处理工作,80%的时间专注于高价值情报的生成与决策支持活动。 图5 科技情报工作的范式转型 3.2 基于情报智能体的科技情报工作新生态 基于情报内涵以及情报智能体驱动的科技情报工作新范式,结合单智能体和多智能体框架,本文构建了基于情报智能体的科技情报工作新生态,如图6所示。该生态系统通过智能体的协同工作,集成了数据生产、信息组织、知识表示和情报计算四大核心功能模块,显著提升了科技情报工作的智能化水平和整体效率。以下将从整体架构、智能体构成、技术支撑、基础设施及应用流程5个方面详细阐述该生态的结构和优势。情报智能体驱动的科技情报工作新生态基于多层架构设计,主要包括4个部分:智能体集群、软件工具、基础数据和基础设施。内外协同运行:对内,通过集成调度工具、基础数据和基础设施资源,实现数据生产、信息组织、知识表示和情报计算四大核心功能的高度自动化;对外,通过智能体与情报专家及具体情报场景的交互,形成“人与智能体协同”的工作新范式。软件工具和基础设施为构建情报智能体提供了强有力的技术支撑,确保了智能体在各个工作环节中的稳定运行和高效协同。基础数据则涵盖了科技论文、专利以及社会经济等情报数据,为情报分析提供了丰富的数据源。通过各模块的协同工作,新生态实现了科技情报工作的闭环流程,为情报专家提供了系统化、自动化和智能化的支持。基于情报DIKI理论阐释,在新生态系统中,智能体集群包括4类情报智能体,分别承担数据生产、信息组织、知识表示和情报计算任务。通过这4类情报智能体的协同工作,推动科技情报工作朝向全面自动化和智能化方向发展。4类智能体的功能及作用体现如下。(1)数据生产类智能体,负责采集和生成情报数据。这类智能体可以自动从多种来源获取数据,包括学术文献、专利信息、网络资源等,为情报工作提供丰富的数据支持。通过自动化的数据采集和预处理,数据生产类智能体能够显著提高数据获取效率,并减少人工参与的需求。(2)信息组织类智能体,负责将数据进行分类、整理,形成结构化的信息。信息组织类智能体通过语义分析和分类技术,将原始数据加工为符合情报需求的结构化信息,从而便于后续的知识表示和情报分析。这类智能体可以实现自动的知识图谱构建和主题分类,为情报工作的知识构建打下基础。(3)知识表示类智能体:通过知识图谱、语义网络等方式,将信息转化为可解读的知识。知识表示类智能体在对信息进行进一步抽象和关联的基础上,构建出知识图谱,将数据和信息转化为可视化和结构化的知识体系,为情报计算和分析提供了深度支持。(4)情报计算类智能体:负责运用大模型和其他AI技术,对知识进行计算分析,生成高价值的情报结果。这类智能体可以通过趋势分析、社会网络分析等方法,从数据中挖掘出潜在的情报价值,揭示隐含的关联关系,从而为决策者提供深度的情报支持。 图6 基于情报智能体的科技情报工作新生态 3.3 构建情报智能体的关键任务方向 为了使情报智能体更好地适应未来科技情报工作需求,其构建不仅需要解决当前技术应用的适用性问题,还需前瞻性地考虑后续应用中的安全风险防控,下面具体论述两方面应重点关注的任务方向。就情报智能体的构建方面,需要解决数据和工具技术方面的关键问题,建立一个多模态规范对齐的可靠知识库和全面的工具技术库。由于情报数据来源多样,格式、质量和结构各异,必须开发先进的数据融合和语义对齐技术,确保智能体能够从多源数据中提取有效信息。通过提升特征提取、噪声处理、数据审核和语义对齐技术,构建一个高质量的知识库,支撑智能体在情报分析中的可靠性和适用性。同时,针对情报分析流程中的各类情景需求,需建立开放的工具技术库,包括情报计算工具、AI模型和通用分析工具,规范接口和使用标准,以便智能体在实际应用中可以灵活调用。加强这些关键工具和资源的建设,为智能体在复杂情报任务中的应用奠定技术基础。在情报智能体的应用过程中,安全治理和使用监管至关重要。智能体的高自主性和复杂的推理能力带来了内容生成的不可控风险,因此需要构建强大的验证系统,确保输出内容的准确性和可追溯性。监管任务还需关注智能体在情报分析中的行为合规性,通过严格的同行评议、版本控制、动态更新日志等手段,保持智能体应用的透明度。此外,为避免人类对智能体的过度依赖,需制定清晰的交互指导方案,加强人类用户的意识培训和能力提升,确保“人在环路”的协同机制得以实现。通过对安全、伦理和监管体系的不断完善,推动情报智能体在确保可信和合规的前提下,安全应用于情报分析工作中。 4结  语 科技情报工作每一次变革与发展都围绕着先进信息技术的应用展开,情报技术在科技情报工作范式变革中发挥着核心驱动作用。在大模型与Agent融合技术的推动下,构建与应用情报智能体已成为科技情报工作的必然选择。本文深入剖析了AI赋能科学研究的驱动方式,提出AI技术赋能科技情报工作的主要方式包括情报基础建设(即数据生产、信息组织和知识表示)和情报生成的计算过程,情报智能体能够实现这两种赋能方式的深度融合。在基于情报智能体的科技情报工作新生态中,智能体集群是核心模块,实现数据生产、信息组织、知识表示和情报计算四大核心功能的自动化。未来在情报机构在规划建设未来情报智能体时,为确保情报智能体稳定运行,应重点关注技术适配性以及潜在安全风险的识别与防控,确保系统的高效性、鲁棒性和可持续发展。

    发布时间: 2025-07-23

  • 93. 国际图联发布“图书馆协会与可持续发展目标”调查结果
    程冰
    2023年7月3日,根据国际图联“图书馆协会与可持续发展目标”调查显示,世界各地图书馆协会对《联合国2030年可持续发展议程》(United Nations 2030 Agenda)及可持续发展目标(Sustainable Development Goals,SDGs)的认知度和参与度都很高。其中撒哈拉以南的非洲、拉丁美洲和加勒比以及中东和北非地区的协会表现尤为突出。 国际图联图书馆协会管理组(Management of Library Associations Section)目前正在组织“可持续发展目标与图书馆协会”(Sustainable Development Goals and Library Associations)的系列网络研讨会,本次调查是该系列研讨会的补充。它概述了世界各地图书馆协会将可持续发展目标纳入未来规划和资源配置中的程度。 图书馆协会不仅在支持图书馆和图书馆员工作方面发挥关键作用,在宣传倡导方面也有重要影响。协会的参与意味着图书馆距离可持续发展目标的实现更近了一步。 本次调查凸显了在“提高可持续发展目标意识”方面取得的成果,超过85%的协会在“非常了解可持续发展目标”下选择了“同意”或“强烈同意”。超过70%的协会积极参与提高成员图书馆的可持续发展意识。 然而,意识只是第一步,只有当可持续发展的理念融入到思维模式和行为模式中时,真正的影响才会到来。基于此,本次调查得到的数据才值得庆祝,因为大约55%的受访协会“同意”或“强烈同意”《2030年议程》有助于其工作规划的制定。 44%的受访协会表示设有专人或专门委员会,负责围绕可持续发展目标开展工作,从而使协会更容易发现机会并与其他机构合作。 另外,调查显示,可持续发展目标也成为了图书馆协会宣传工作的一部分,超过一半的受访协会表示正在推广可持续发展目标并从中获得支持。然而,参与自愿国家审查进程或各国内部正式可持续发展目标部门的图书馆数量仍然较少。 调查数据按地区进行了分类,从中可以看出,撒哈拉以南非洲、拉丁美洲和加勒比以及中东和北非地区的大多数协会在致力于实现可持续发展目标方面表现最积极,欧洲紧随其后。 除了动员图书馆协会积极参与可持续发展目标进程以外,调查结果也给出一些实用的建议。比如,在如何将可持续发展目标纳入规划和宣传方面,有很多积极的经验可以分享,也有潜力提高图书馆在国家内部可持续发展目标活动的参与度。

    发布时间: 2023-07-11

  • 94. Cactus Communications 与 eLife 合作
    程冰
    Cactus与eLife合作,集成了一款AI驱动的工具包,用于优化学术出版的编辑流程。该工具Paperpal Preflight for Editorial Desk旨在通过自动检查提高手稿的语言质量和技术合规性,并在提交同行评审前识别潜在问题,同时由博士级专家对结果进行审核。这一合作强调了对研究诚信的重视,旨在支持高标准的学术作品质量和完整性。

    发布时间: 2025-07-23

  • 95. 突破从何而来?利用专利知识网络识别突破性技术创新
    程冰
    2025年5月5日,华侨大学的周文浩等学者在Scientometrics上发表一项研究,利用专利知识网络识别突破性技术创新。突破性技术创新有可能颠覆技术范式,是技术进步的关键驱动力。理解此类创新的来源需要分析其知识组成。尽管以往研究在该领域提供了宝贵见解,但常常忽视知识的可转移性,这可能影响知识新颖性测量的准确性。为填补这一空白,本文利用 BVSR 模型概念化突破性技术创新的知识流动过程,并提出了一种在专利层面建模知识网络的新方法。该方法有效量化了专利内的知识结构和组合,能够识别技术新颖性并评估其影响。在对 4684 项医药专利的实证分析中,我们识别出 723 项跨越五种不同知识结构的突破性技术创新。最后,一系列稳健性检验进一步验证了本文对识别结果的有效性和稳健性。

    发布时间: 2025-07-23

  • 96. 用于高价值专利识别的跨模态深度学习方法研究
    程冰
    [目的/意义] 精准识别高价值专利已成为我国知识产权强国建设的重要环节,对推动我国科技创新的高质量发展至关重要。[方法/过程] 提出跨模态深度学习架构LMI,通过融合文本、图像、指标三种模态信息,实现高价值专利的精准识别。首先,基于专利文件抽取文本信息、摘要附图、评估指标,并进行文本拼接、分词、图像大小统一等预处理操作;然后,采用LSTM提取文本特征,采用MobileNetV2提取摘要附图特征,将文本特征、图像特征与评估指标拼接融合,得到不同模态信息融合的多维特征;最后,将多维特征输入到全连接层,结果经sigmoid函数输出。[结果/结论] 与基于单模态、双模态信息的模型相比,LMI方法能够更精准地识别高价值专利。

    发布时间: 2025-07-22

  • 97. Open Future和OSI联合发布《开源AI中的数据治理:实现负责任与系统性访问》白皮书
    程冰
    2025年1月,Open Future与OSI联合发布《开源AI中的数据治理:实现负责任与系统性访问》白皮书。随着开源人工智能(Open Source AI)的发展,数据治理成为确保技术民主化、公平性和透明度的关键。文中探讨了数据治理和 AI 开发中的关键挑战,包括数据治理与道德使用、开放性标准和透明度、数据中的结构性偏差、环境可持续性以及利益相关方代表性(Stakeholder representation)等方面。 为了应对这些挑战,文中提出两个关键范式转变。一是采用数据共享方法,从开放数据框架转向更广泛的数据共享治理,其中包括各种形式的数据共享,保护权利并确保公平使用,这种方法承认数据的不同性质,从完全开放的数据集到受限的数据集,并促进创新的许可模式,例如数据信任和合作;二是扩大利益相关方范围,在 AI 生命周期中吸引更广泛的利益相关方,包括内容管理员、数据管理员和受影响的社区,通过促进 AI 开发人员和这些群体之间的合作伙伴关系,可以负责任地创建、管理和共享新的数据集。 最后,本文提出了六大行动领域,具体如下: 1.数据准备和溯源(Data preparation and provenance):为数据收集、分类、匿名化和元数据建立稳健的标准,以确保质量和可追溯性。 2.偏好信号与许可机制(Preference signaling and licensing):开发诸如退出框架(opt-out frameworks)和社会许可(social licenses)等机制,以使权利持有者和社区能够控制数据的使用。   3.数据管理员与保管员(Data stewards and custodians):强化数据管理的角色,包括作为中介机构促进数据共享,同时确保符合伦理治理。   4.环境可持续性:通过共享数据集和高效的训练方法,推广减少AI对环境影响的做法。   5.互惠与补偿((Reciprocity and compensation):实施确保从共享数据中产生的价值公平分配的机制,特别是向边缘化社区的分配。   6.政策干预:倡导实施公共政策,要求数据透明化,激励数据共享,并支持开放数据集的创建。   开源AI有潜力推动创新、增强透明度,并在AI领域促进公平。实现这一愿景需要从以数量为主导的数据实践转向以质量和治理为核心的方法,通过采用数据共享框架、扩大利益相关方参与并解决关键的治理挑战,开源AI社区可以培育一个更具包容性和可持续性的AI生态系统。

    发布时间: 2025-07-23

  • 98. 如何识别可疑论文:科学家的侦查指南
    程冰
    2025年6月10日,研究诚信专家团队推出《开放科学诚信指南合集(COSIG)》,帮助研究人员和出版商识别有问题的研究。该工具包整合27个免费资源,系统梳理了如何识别图像重复、引用操纵、AI生成文本、纸厂论文等问题,涵盖生物学、化学等多学科审读技巧,并提供Feet of Clay Detector、Imagetwin等在线工具使用指南,帮助科研人员和出版商掌握筛查可疑论文的方法,扩大科学诚信审查的参与度。 相关工作:10.17605/OSF.IO/2KDEZ 软件地址:https://github.com/cosig-pppr/cosig

    发布时间: 2025-07-23

  • 99. Wiley发布作者AI使用指南
    程冰
    3月13日,Wiley在伦敦书展上发布了一套关于人工智能在创作中负责任和有效使用的指南,以帮助作者在稿件准备过程中利用AI工具,并保持作者的真实声音和专业知识,确保内容可靠、准确并保护知识产权和隐私。 Wiley的指南回应了约70%的研究人员对出版商在使用AI方面提供指导的需求,Wiley执行副总裁Jay Flynn表示:“作家和研究人员已经在使用AI工具,无论出版商是否愿意接受这一变化,我们希望拥抱这一转变,而不是抵制。” 新发布的指南为作者提供了实用建议,包括如何开始使用AI、比较和分析不同AI工具的准确性、隐私和知识产权等方面,以及如何在已发表作品中跟踪和披露AI的使用情况。Wiley还计划在未来几个月内发布针对研究人员需求的额外常见问题解答(FAQs)。这一指南为作者提供了使用框架,帮助学术界如何适应新技术。

    发布时间: 2025-07-23

  • 100. 国际图联战略:2024-2029
    程冰
    10月1日,国际图联发布文件公布其2024-2029 年战略。该战略规划聚焦于三个主要领域,以实现图书馆在全球范围内的互联、赋能和认可: 1、图书馆通过全球专业社区实现连接并保持活力 2、图书馆作为合作伙伴得到认可、代表和重视 3、使图书馆能够在各个层面进行有意义的变革 由于国际图联的独特地位,可以保障其发挥该战略中规定的作用。为了在国际图联的第二个一百年做到这一点,国际图联需要继续关注如何最有效地履行自己的使命。通过这种方式,可以实现一个良性循环,吸引活跃的会员、专家志愿者和优秀的合作伙伴,反过来使国际图联能够更好地通过图书馆实现进步。

    发布时间: 2024-10-31

相关报告