...

《数智化图书情报监测快报》

  • 来源专题:数智化图书情报
  • 编译类型:快报,简报类产品
  • 发布时间:2024-01-20
数智”赋能正逐步成为推动图书情报领域创新发展的新动力,大数据+人工智能等新技术为图书情报领域发展带来了新机遇,数智化图书情报监测快报聚焦大数据、人工智能等技术在图书情报领域应用现状,跟踪最新研究成果,为领域研究人员提供信息支撑。
  • 1. LIBER和ADBU发布关于研究型图书馆内开放科学服务的联合报告
    程冰
    研究目的 欧洲的许多研究图书馆在研究数据管理(RDM)和开放获取(OA)领域提供开放科学服务。然而,约有多达一半的欧洲研究图书馆在这些领域仅提供有限的服务。这项LIBER/ADBU研究的重点是了解这些服务所需的组织结构和能力,以支持整个欧洲的研究图书馆通过本研究的工具包加速采用以上两项开放科学服务。 科技资源开放共享的浪潮正在改变我们获取和传播科研信息的方式。在这一背景下,变革期刊(Transformative Journals, TJ)模型被设计出来,以帮助订阅型出版商成功过渡到全面并即时的开放获取(Open Access,OA)。近日,cOAlition S发布了关于2022年变革期刊进展的数据报告,这是一次深入理解模型运作情况的机会。 研究方法 本研究采访了在这些领域拥有发达和/或先进支持服务的图书馆。基于这些访谈,报告描述了RDM服务的四个发展阶段及其所需的相关组织结构和能力、OA服务的三个发展阶段。RDM支持服务图书馆旨在为研究人员提供涵盖整个数据生命周期的RDM支持服务和基础设施。数据生命周期由三个阶段组成:(1)研究项目的准备以及数据管理计划(DMP);(2)使用所谓的“活动数据”执行研究;(3)发布/归档结果数据集的最后阶段。为了创建在整个数据生命周期支持研究人员的服务组合,图书馆与其他内部利益相关者(例如IT部门、研究办公室、数据保护官员、道德委员会和技术转让办公室)之间需要协作。图书馆的一个重要作用是连接和协调这些利益相关者的活动,并为研究人员提供RDM支持服务。 具体来说可分为四个发展阶段: ?初始阶段:研究资助组织越来越多地要求为其资助的研究项目制定数据管理计划(DMP)。这促使许多研究图书馆开始开发DMP支持服务。该服务通常与现有数据存储库和数据档案的转介服务相辅相成——与其他传统转介服务一致。因此,大多数图书馆RDM服务的起止时间与数据生命周期一致。 ?发展阶段:该阶段服务覆盖数据全生命周期。用于存储和共享活动数据的基础设施、培训和咨询服务通常由IT部门与图书馆合作提供。归档和发布支持服务主要包含用于发布和归档数据集的机构数据存储库(或国家存储库中的机构空间)。这一阶段的图书馆服务是普适性的,并不区分学科。 ?成熟阶段:在此阶段,咨询服务更加专业化。这需要在院系/研究部门中配备数据管理员。规模较大的研究机构促使RDM服务发展出多级组织服务结构。与此同时,图书馆也经常聘请“社区经理”来促进协作和知识交流。 ?高级阶段:此高级阶段的服务可以包括:(1)为执行操作任务的研究项目团队提供“借用”数据管理器;(2)机构研究人员对存档/发布的数据集进行监控;(3)开发围绕研究软件服务。 其中涵盖了六种工作类别:通用数据管理员或数据图书馆员、嵌入式数据管理员、数据经理、教育者/培训师(主要是数据图书馆员/数据管理员的任务的一部分,有时是一个单独的职位)、数据管理员(用于管理数据集) 存放在数据存储库中)和社区经理。 在 “RDM 支持服务“的开发过程中,可以观察到两条断层线(fault lines): ?组织结构:“RDM支持服务”从发展阶段向成熟阶段的转变,一般表现为以图书馆为中心的服务组织向一线/二线组织结构的分布式模式转变。第一线服务的数据管理员(嵌入研究部门或院系)有时由图书馆雇用,有时由院系雇用。 ?能力:“RDM支持服务”在初始和发展阶段所需的能力通常可以由传统图书馆员来满足,他们可以在工作中学习额外的、与学科无关的能力;对于处于成熟阶段的面向学科的“RDM支持服务”则通常需要不同的能力。因此,嵌入式数据管理员、高级阶段的数据管理员这两个职位往往会聘请具有特定学科研究背景的人员,原因在于他们需要具备研究数据管理的操作能力。OA服务OA服务总体目的是提供一条通往开放获取的多路,以避免单一开放获取路线的主导地位:目前,开放获取的主要驱动力是资源库中作者被接受稿件的绿色OA,黄金OA期刊中的APC付费文章,以及图书馆和出版商之间的阅读与出版协议所产生的混合期刊中的开放获取文章。人们普遍担心黄金和混合OA成本的增加,导致最近钻石级开放获取期刊的发展。在所有途径中,图书馆都发挥着至关重要的作用。 可以观察到三个发展阶段: ?初始阶段:OA服务的初始阶段包括与存储库相关的服务以及有关OA的一般教育和培训。大多数欧洲研究图书馆都运营一个存储库,并设有适当的工作流程来支持和刺激研究成果的存放,例如存储库中的绿色OA文章。该存储库可以是机构存储库,也可以是国家存储库,例如法国的HAL。 ?发展阶段:在此阶段,主要的附加服务是支持研究人员选择 OA 期刊,并在黄金期刊(通过用 OA 基金补偿 APC)或混合期刊(通过阅读和发布合同)中发表开放获取文章。 ?高级阶段:在此阶段,图书馆通过提供具有技术支持的OA期刊平台或为期刊和/或专着开发全方位服务的大学出版社来提供机构Diamond OA出版服务。作为开放教育资源的一部分,其中一些Diamond OA出版社也开始出版开放教科书。 可以区分五种工作类别:数字奖学金图书馆员/前台职能的其他图书馆员、CRIS 和/或存储库经理、开放获取基金经理、阅读和出版许可证经理、Diamond OA 出版商。 关于服务所需的组织结构和能力,有两点很重要: (1)组织结构:与已开发的RDM支持服务相比,中央组织模型似乎最适合大多数OA服务,即使处于高级阶段。 (2)能力:Diamond OA出版商的能力似乎存在断层。虽然其他工作类别由图书馆员完成,但对于Diamond OA出版服务,许多图书馆雇用具有出版背景的人员。其他利益相关者眼中图书馆的附加值来自机构内利益相关者以及(国际)国家利益相关者的受访者认为研究图书馆在OA和RDM支持服务方面的附加值有两个方面: (1)中介功能:图书馆基于对研究背景和研究人员工作环境的理解,一方面协调和连接研究人员与其他内部利益相关者之间的中介 (2)与开放科学服务相关的具体能力,例如:全面了解机构和研究资助者在开放科学、开放获取、公平研究数据、研究诚信、道德等方面的监管和政策环境等等;数字出版方面的元数据标准、本体、许可证、版权、标识符和长期保存方面的技术专长;图书馆确实已经支持出版物形式的研究成果,这使它们成为支持研究数据集形式的研究成果的合适方。开放科学的其他方面本研究重点关注OA和RDM支持服务。然而,开放科学的其他方面与研究诚信、研究评估和参与性研究(公民科学)有关。一些拥有先进OA和RDM服务的图书馆已经建立了组织结构来发挥协调和连接作用,旨在在整个机构内促进最广泛意义上的开放科学。 内容编译来自GoOA头条 原文来自:https://libereurope.eu/wp-content/uploads/Open-Science-services-by-Research-Libraries-organisational-perspectives.pdf

    发布时间: 2023-07-11

  • 2. 《ARL/CNI场景设想:人工智能影响下的未来》完整版发布
    程冰
    当地时间2024年6月27日,北美研究型图书馆协会(Association of Research Libraries,ARL)与网络信息联盟(Coalition for Networked Information,CNI)发布了完整版《ARL/CNI 场景设想:人工智能影响下的未来》(Deluxe Edition of the ARL/CNI AI Scenarios: AI-Influenced Futures)。该出版物作为研究型图书馆和相关组织的重要资源,旨在对人工智能带来的变革性影响力进行战略规划。 文件内容主要包括: ·设想场景集合:该场景集探讨了人工智能发挥关键作用的未来情况,为研究环境不断变化的挑战和机遇提供了关键性见解。 文件内容,见 http://www.chinalibs.net/ArticleInfo.aspx?id=570674&cb=qinyue。 ·战略背景报告:ARL和CNI在2023-24年冬季和2024年春季举行了关于“人工智能对未来研究环境的影响”的焦点小组会议和访谈,该报告收集了通过以上活动获得的社区反馈信息。 文件内容,见 http://www.chinalibs.net/ArticleInfo.aspx?id=570677&cb=qinyue。 ·人工智能领域行业领袖访谈报告:这些访谈以与行业领袖的前瞻性对话为特色,挑战传统智慧,激发了人们对人工智能影响下的未来的延伸思维。 文件内容,见 http://www.chinalibs.net/ArticleInfo.aspx?id=570679&cb=qinyue。 该版本旨在通过为研究型机构的利益相关者提供必要的工具和知识,来预测和塑造人工智能时代研究环境的未来方向,从而为其赋权。 ARL曾在2024年5月发布过该文件的初始版本,随同发布的文章大致罗列并解释了ARL和CNI对人工智能影响下的未来设想场景,欲了解相关信息,参见往期文章: http://www.chinalibs.net/ArticleInfo.aspx?id=565723&cb=qinyue。

    发布时间: 2024-07-26

  • 3. 英国研究与创新署更新其对图书开放出版的资助政策
    于彰淇
    11月15日,英国研究与创新署(UK Research and Innovation,UKRI)发布了更新的关于专著、书籍章节和编辑集的开放获取政策。自2024年1月1日起,受其资助的专著、书籍章节和编辑集需要在出版后12月内对公众开放获取。为此UKRI提供了350万英镑的专项资金,用于支持该政策范围内长篇出版物的开放获取成本。这是继2021年UKRI更新政策,要求自2022年4月起受其资助的研究论文需要在出版后立即对公众开放获取后的又一重大更新。该政策旨在确保英国研究与创新 (UKRI) 公共资金资助的广泛研究成果可以自由获取。这将使研究和创新界以及更广泛的社会更容易地利用研究结果。该政策还寻求支持更广泛的社区发展长篇研究出版物的开放获取。申请将于2023年11月开放新基金将于2023年11月28日开始接受第一阶段申请。研究机构将能够为资金注册出版物,并从英国研究与创新署获得确认,确认出版物在基金范围内。第二阶段申请,即研究机构确认出版并由英国研究与创新署按公布的最高水平报销费用,将于2024年1月开放。资助额度可申请的资助额度为:单部专著或编辑集的开放获取,若支持书籍处理费(BPC),可获得最高10,000英镑的资助。钻石或非BPC开放获取方案,若有一个符合英国研究与创新署(UKRI)资格的专著或编辑集在该方案下出版,可获得最高6,000英镑的资助;若有两个或更多符合条件的出版物,则最高可获得9,000英镑的资助。书籍章节处理费可获得最高1,000英镑的资助确定以上资助额度,英国研究与创新署(UKRI)的目标是:支持研究人员和机构发表开放获取作品。支持多样化的资金模型。确保资金的可持续性。确保资金使用的性价比。资金可用于支持立即发表的具有知识共享许可的记录版本。作者和研究组织可以在出版后 12 个月内将记录版本或作者接受的手稿开放获取,以遵守该政策。有关新开放获取基金的所有指南均可在??开放获取资助和报告中找到。https://www.ukri.org/manage-your-award/publishing-your-research-findings/open-access-funding-and-reporting/

    发布时间: 2023-12-01

  • 4. 数字学术服务的内容与形式:一项系统综述和比较研究
    闫亚飞
    1.从数字学术定义数字学术服务 顾名思义,“数字学术服务”是为“数字学术”提供服务,即面向科研人员的数字学术行为和需求,图书馆与出版商等服务主体相应地利用多种数字技术与方法嵌入数字学术全过程或具体场景提供服务。不同图书馆对此也有不同的理解和业务范畴,例如:美国匹兹堡大学图书馆认为数字学术服务是图书馆资源、专业能力和服务的前端,支持一系列数字化和数据密集型学术活动,该图书馆数字学术服务的主要领域包括编程和计算支持、研究数据服务、数字创作和管理、地理空间数据与分析、文本挖掘与分析等。香港中文大学图书馆表明会利用数字证据、工具、方法及程序去协助教研人员和研究生进行学术研究,并通过提供空间、工具、平台、培训及咨询等服务嵌入学术研究周期支持和推广数字学术。美国莱斯大学图书馆的数字学术服务主要是通过提供基础设施、咨询和培训,促进在研究、学习和学术交流中有效地、创造性地使用数字技术。基于学术交流、教学研究、数字技术和数字产品等数字学术的内涵,图书馆通常通过列举主要服务手段和内容、列举主要服务场景和目标等方式定义各自的数字学术服务。 2.图书馆“数字学术服务”的名称与形式 2017年,笔者对若干研究型图书馆的数字学术服务进行了广泛的探索性预调研,在此基础上考虑图书馆网站是否有实质性的“数字学术服务”内容,最终选择15所图书馆为调研对象,调查分析并总结归纳了图书馆数字学术服务的内容和特点;2022年,为了进行准确的对比分析,本文再次选择同样的15所图书馆为调研对象,以期更好地呈现数字学术服务的动态发展过程、为图书馆持续深入探索数字学术服务提供有益参考。图书馆“数字学术服务”有“数字学术研究服务”(DigitalScholarshipResearchservices)、“数字学术空间”(DigitalScholarshipCommons)、“数字学术实验室”(DigitalScholarshipLAB)、“数字学术中心”(CenterforDigitalScholarship)等名称和形式,且处于动态发展变化之中。根据调研可知:①部分图书馆(如北卡罗来纳大学夏洛特分校图书馆)取消了专门的“数字学术服务”栏目但并没有取消相应的服务,而是将相应服务并分散在不同的服务栏目之中,如研究数据服务、数字出版服务等;②部分图书馆(香港中文大学图书馆、哥伦比亚大学图书馆)的“数字学术服务”名称略有调整;③部分图书馆(如埃默里大学图书馆)将合作的“数字学术中心”转移给校内IT部门;④部分图书馆(如圣母大学图书馆、香港中文大学图书馆、哥伦比亚大学图书馆)既设置“数字学术服务”栏目,同时又在其他栏目提供更多属于“数字学术服务”的相关服务。 3.图书馆“数字学术服务”的内容及分类 根据前文从学术交流、教学研究、数字技术、数字产品等角度对“数字学术”内涵的阐述,除“数字学术服务”栏目所包括的服务内容之外,本文也调研分析了其他栏目的数字学术服务相关内容,据此总结数字学术服务的内容及分类。根据2017年8月的调查,数字学术服务内容包括物理空间、数字科研工具、研究数据服务、学术交流与数字出版服务、数字人文服务、数字学术研讨与培训服务、数字技术支持服务等7类;根据2022年8月的最新调查,数字学术服务服务内容可归纳为物理空间及设施设备服务、学术交流与数字出版服务、数字教学与研究服务、数字产品制作服务、数字技术支持服务、数字人文服务等6类。需要说明的是,数字学术服务包括多种多样的具体服务内容,同一服务内容也可纳入不同的类别。对比发现,这15所图书馆2017年和2022年数字学术服务的动态变化在于:①整体图书馆的数字学术服务内容变化不大;②个体图书馆的服务内容呈现适度减少和聚焦趋势,其中适度减少的服务包括基础性培训与咨询服务,同时特殊数字化设备及其服务采取先申请再服务(按需按序服务)的方式加以适当限制;适度聚焦于文本挖掘与分析、研究数据管理、数据可视化设备及服务、数字出版和数字展览、数字化设备与制作服务、数字学术项目合作与服务等。 3.1物理空间及设施设备服务一方面,图书馆“数字学术服务”名称本身包含物理空间成分,如“数字学术空间”“数字学术实验室”“数字学术中心”等称谓本身便表征了数字学术的一种空间存在;另一方面,“数字学术服务”大多设有专门功能的空间服务,尤其是研讨、协作和可视化空间。根据调研,图书馆用于数字学术服务的空间主要可分为两类,一是技术性空间,配备了相应的数字硬件和软件设备,如3D打印机、VR设备、高分辨率可视化墙、高分辨率扫描设备等;二是协作性空间,为教职人员和学生提供研讨、协作、共享服务。 3.2学术交流与数字出版服务图书馆是学术交流生态系统中不可或缺的一环,数字学术环境下学术交流包含讨论、发表、展览、传播等活动形式,图书馆相应提供开放获取、数字出版、版权咨询、数字展览与传播等方面的服务:开放获取服务:包括开放获取政策、开放获取咨询、开放获取基础设施支持等;版权与合理使用咨询服务:包括版权与合理使用咨询、相关辅助性资源等;数字出版及存储平台服务:包括开源数字出版平台推荐及服务(如OmekaS、OpenJournalSystems)、机构数字知识库/存储库平台服务等;数字展览服务:数字展览平台及展览展陈服务、宣传推广服务等。 3.3数字教学与研究服务大学与研究图书馆的基本使命之一便是为教学与研究提供服务,数字教学与研究服务是数字学术服务的重要内容,主要表现为:数字教学支持服务:包括开放教育资源推荐与集成、开放教学支持(一手资料的管理与数字化、从已有数字馆藏中获取高分辨率图像复制品)、数字课堂支持与服务;数字研究支持服务:包括文本挖掘与分析、元数据、数据可视化、研究数据管理、地理信息系统(GIS)服务、研究影响力评价等;数字研究项目合作及服务:图书馆以合作伙伴或服务者等角色主导或参与校内外数字研究项目的规划、实施、管理及技术支持;数字技能培训:数字化教学与研究技能的培训,包括各种形式的工作坊、研讨会等。 3.4数字产品制作服务数字产品制作服务通常与物理空间及设施设备服务、数字出版服务等密切相关。除数字出版物之外,数字产品制作服务还包括相关工具、场所及服务:多媒体产品设计与制作,如视频、音频等多媒体产品;高分辨率数字产品制作,如使用Adobe系列软件制作图像;大幅面资料扫描与数字化制作,如地图等。 3.5数字技术支持服务图书馆通常在数字学术项目和数字学术活动的任何场景提供用户所需要的技术、软件工具、平台及基础设施支持,包括但不限于数字馆藏平台、开源网络出版平台、数字展览平台、数字存储平台、数字软件及技能支持(如文本挖掘、网络爬虫、机器学习、自然语言处理及Python、R等编程软件)等。 3.6数字人文服务如前所述,“数字人文”被认为是人文社会科学领域的数字学术,因此数字人文服务也是一种特殊的数字学术服务。部分图书馆在“数字学术服务”栏目内设置“数字人文”服务(如香港中文大学图书馆);部分图书馆在“数字学术服务”栏目之外设置“数字人文”服务(如圣母大学图书馆);部分图书馆的数字学术服务即数字人文服务(如里士满大学图书馆)。根据调研,研究型图书馆所提供的数字人文服务主要包括数字人文概念推广及软件工具支持、数字人文实践社区服务、数字人文项目合作与服务等。 4.图书馆数字学术服务的框架要素数字学术服务内容丰富、形式多样,为了从抽象层面更好地加以概括,笔者参考常见的图书馆服务框架模型并将数字学术服务的框架要素归为服务对象、服务手段、服务场景和服务内容4个方面,首先,图书馆数字学术服务的服务对象主要为图书馆所在母体机构的学生、教师和职员等学术用户,与传统学术服务的对象并无明显差别。其次,服务手段主要包括空间、技术(软件、平台)、资源(馆藏资源、开放资源)、设备和人员,图书馆员借助空间、技术、资源和设备等条件并结合自身的经验和智慧为用户提供各类服务。再者,图书馆数字学术服务的服务场景可分为两类:在数字学术项目过程中提供服务,即服务于项目(project)形式的数字学术活动;在具体而分散的多种数字学术活动中提供服务,即服务于具体的数字化创造、出版、管理、保存、传播、评价等一种或多种活动。在此基础上,图书馆提供物理空间及设施设备服务、学术交流与数字出版服务、数字教学与研究服务、数字产品制作服务、数字技术支持服务、数字人文服务等多种服务内容。 5.图书馆数字学术服务的组织形式 5.1机构设置方面在校内二级机构归属层面,图书馆数字学术服务的设置包括以下3种情况:由图书馆和校内其他部门合作并共同建设和运营,如华盛顿大学图书馆的开放学术空间与EScience部门、人文中心、学习技术中心等多个校内部门联合运营;原本由图书馆和校内其他部门合作但后来被图书馆移交出去,如埃默里大学图书馆将数字学术中心移交给校内IT部门;由图书馆独立或主要承担各项运营和服务工作,被调研的大部分图书馆都属于这种情况。因此,整体来看图书馆负责数字学术服务是主流情况,图书馆与校内机构合作负责数字学术服务也是一种可供借鉴的模式。在图书馆内部部门设置层面,图书馆数字学术服务的设置包括以下几种情况:图书馆专门设有数字学术服务相关部门;将数字学术服务设在其他上位服务部门;图书馆不设数字学术相关部门或未展示是否有相关部门。可以认为,提供数字学术服务与是否专门设置数字学术服务相关部门无必然关系,主要取决于图书馆的实际情况。在图书馆部门的团队配备和人员设置层面,所有被调研的图书馆数都以相关名称展示了数字学术服务团队及人员情况。 5.2人员设置方面在人员组成方面,图书馆数字学术服务人员主要由图书馆职工组成,部分图书馆设有学生助理、博士后研究人员等。在人员角色方面,相关人员围绕数字学术服务的“主责主业”承担着多样化、跨学科的角色,其岗位名称主要依据具体负责的业务范畴或工作内容而确定的,如数字学术馆员、学术交流馆员、版权馆员、研究数据服务馆员、学术出版外展(outreach)馆员、在线出版设计师、数字技术馆员等。在人员规模方面,整体而言数字学术服务人员规模不大,以4—6人、8—10人最为常见。 5.3岗位要求方面从图书馆员岗位名称、工作内容及成员介绍等可以看出,数字学术服务不仅要求图书馆员具有基本的图书馆业务知识和技能,还倾向于馆员拥有多学科背景或掌握多种数字技能,并且馆员的兴趣爱好也非常多元化并具有学科跨度。总之,数字学术服务馆员需要不断学习新知识、新技能以更好地适应岗位要求并满足用户需求。

    发布时间: 2023-07-11

  • 5. 数智赋能标准情报服务创新:内在逻辑与实现路径
    闫亚飞
    在数智为王的时代,大数据提供了助推标准情报服务创新的新思维、新手段,已成为标准情报工作提质增效的新利器。 以构建高质量的标准情报服务模式为价值目标,在明晰数智赋能标准情报创新内在逻辑的基础上,按照价值效益的需求,有必要进一步探究新形势下服务创新发展的具体实现路径,以推动标准情报服务创新过程稳定有序开展,充分发掘服务价值增长的新动能。 1. 数智赋能标准情报服务创新的实现机理 数据作为数智化的核心资源要素,是发挥标准情报服务价值的基础,然而数据孤岛与数据碎片化问题却成为制约服务效能提升的沉疴痼疾。 如何梳理和整理标准情报数据,使之体系化、规范化,并将整个链路打通为完整闭环,便成为标准情报服务创新转型的价值诉求所在。 随着数智化在标准情报服务领域不断深入,亟需依靠数智赋能对海量标准情报数据进行深度挖掘,以发现数据之间的关联规律,充分释放数据流来催生新的服务价值。 事实上,让数据说话,以数据为引领的标准情报服务可以更有效地协调各种资源,并通过数据对情报行为和要素的作用进行预判,从而实现快速迭代和调节。 因此,以“数据即服务”为路径导向,本文对数据要素价值转化的全生命周期过程展开分析,以阐明数智赋能标准情报服务创新的实现机理。 a.数据采集,即从数据源收集、识别和选取数据的过程。 该模块运用埋点、探针、爬虫等技术与设备进行数据交互,从资源池广泛读取标准情报生产数据,并将不同资源池中分散、零乱、标准不统一的源数据予以汇聚,批量而精确地采集和抽取用户所需的结构化、半结构化和非结构化数据,最终将其转化为结构化记录,保存至本地标准情报数据库中。 b.数据预处理,旨在对所采集汇总的原始数据进行清洗、抽取、转换、消减及集成等系列操作,通过人工或 AI 方式进行相应加工处理,以提取可用的价值数据和业务数据,从而初步形成标准情报数据资产。 同时,借助数据目录对已采集的结果数据予以多维多层级分类展示,并编辑和删除不合格的数据信息,这可在保障数据标准化和规范化的基础上提高标准情报数据质量,为上层业务提供数据支撑。 c.数据存储与计算,即将可用数据以稳定可靠的结构存储下来,并对其进行全面的统计分析,通过一定模式计算得到标准性能、标准专利、知识产权等多种符合用户需求的数据要素,以供后用。 在不同的标准情报数据应用场景,借助全面的复杂数据分析和计算能力,在全流程上实现资源动态调配,大大提高了资源利用率,实现了高效的情报数据价值转化。 d.数据应用,进入价值变现阶段,以明确的标准情报需求为导向,支持用户对情报数据的多维度多衍生穿透性分析,以准确及时掌控标准的技术和市场倾向动态。 在挖掘数据深层价值的基础上,面向用户提供标准跟踪、研究、咨询、对比等针对性服务,为标准化战略决策制定提供精准可靠的数据支撑,最终实现为标准情报服务的数智化赋能。由此可见,盘活标准情报数据资产,使其为业务管理、运营、决策服务,便是数智赋能标准情报服务创新的价值实现机制。 以数智化技术为依托,聚焦于数据深耕与数据价值挖掘,从数据的采集、处理到数据的分析,再到数据的应用与咨询,层层把控、环环相扣,完成了数据资产化、要素化和价值化的蜕变。 通过数据资源的实时动态更新,标准情报服务亦可不断进行自我进化,始终保持着旺盛的创新生命力。 2. 数智赋能标准情报服务创新的实现路径 数智赋能是标准情报服务持续革新的内在驱动力,是聚集情报数据合力、满足用户多变的定制化服务需求的重要手段。 伴随着情报数据在不同主体间的双向流通、深度融合,数据价值得以充分挖掘、培育和释放,随之联结为全链条无缝衔接的反馈闭环,全方位打通了端对端的数智化应用场景,并为标准情报服务创新落地提供了可行路径,其中涵盖了服务数据化、数据服务化和再循环三个阶段。 a.服务数据化,即服务在线,标准情报服务流程信息化,运用标准情报服务平台承载服务流程。遵循面向情报服务的组件化开发和技术架构设计理念,基于 对用户需求的深刻理解来打造集多源异构数据接入、整合、交换、共享于一体的开放式情报数据服务平台,以实现同构、异构系统之间的数据抽取、格式转换、内容过滤、同异步传输、数据整合存储、数据共享等功能。由此,在保持服务流程优势的同时,不同业务系统间的情报信息可灵活交换、共享与协同,辅助用户以迭代的方式不断完善和扩充信息资源体系,实现了标准情报服务流程的优化与再造。以国家标准文献共享服务平台为例,该平台便提供按行业、按领域、按主题的国内外标准专题数据库,且数据项服务可按照用户需求定制,以便让用户及时了解和掌握所关注领域的最新标准信息或标准制修订活动情况,为产品研发和相关研究提供支撑。 b.数据服务化,即数字智能,将数据分析结果反馈 至情报系统,形成面向业务、面向管理、面向决策、跨具 体业务系统的全局性多角度资源视图,支持用户以多视角观察和发现数据中蕴含的联系和规律,从而为业务管理、标准研判及其战略决策提供详实可靠的参考依据,并为跨部门、跨业务系统的全局性信息资源共享交换和业务协作提供支持。在数据资源整合与综合利用的推进过程中,为各级各类用户提供完整、及时、准确的标准情报数据服务,全面满足用户对于情报数据使用的个性化需求,可将情报数据快速转化为价值生产力,使其在复杂业务场景中迸发出更高价值。国家标准文献共享服务平台设有标准研制贡献大数据分析系统,可从时间、地域、起草单位等维度,实时、动态、可视化地展示标准研制情况,并撰写标准大数据分析研究报告,从而帮助用户全方位、多视角了解标准工作的全貌。 c.再循环,即通过数据沉淀与数据应用,及时收集回笼信息对数据质量进行评估,对数据进行反复打磨,以促进下一次的挖掘优化,达到服务产生数据、数据反哺服务的增量闭环。在此闭环循环过程中,以提高质量效益为中心,将情报数据转化为用户需求洞察,进而由洞察产生行动,这不仅在技术上提升了洞察分析能力,也可在组织、管控、能力等方面同步得到精准提升,确保了“感知→洞察→评估→响应”闭环的顺利运行 并得以循环提升,最终为用户提供全链路的高效标准情报服务,使数据成为推动标准情报服务高质量发展的有力支撑。同样地,经由数据导入与更新、数据加工与内容挖掘、指标自动抽取与人工校对等环节,国家标准文献共享服务平台完成了标准情报信息的全流程管理,为用户提供了标准信息的全流程服务,切实增强了自身的可持续发展能力。

    发布时间: 2023-07-11

  • 6. 人工智能时代的算法素养——内涵剖析与能力
    杨小芳
    人工智能时代的到来强化了技术环境对社会发展的影响,算法的广泛应用塑造着新的社会结构与规则,也对人们的信息处理能力提出了更高的要求。算法素养作为人工智能时代重要的素质能力集合被提出。       在信息时代,信息成为世界运行所仰赖的血液、食物,信息素养则成为人类参与工作和日常生活的基本能力,也成为图书情报学科的重要研究话题。随着信息技术的不断发展,人类社会先后经历了信息时代、数字时代、大数据时代、人工智能时代。为应对技术环境变化,以信息及其载体、表现形式、服务形式为核心,出现了诸如“计算机素养”“数字素养”“数据素养”“AI素养”等概念。       综合已有文献对算法素养的定义,融合功能型定义与解释型定义两大方向,将算法素养定义为:“具备感知、理解和使用算法的能力,能够正确使用以算法为驱动力的产品并具备对算法社会的适应能力。”以此为基础,对算法素养的功能进行更详细的解释,即具备算法素养的人能够:①拥有使用算法及相关技术工具解决所遇问题的能力;②意识到并理解以算法为驱动力的社会及其运行规则;③能够对算法及其产生的正面、负面效应进行客观评价,具备算法风险意识。       算法素养是人工智能时代人类适应社会技术变化的体现。基于对相关概念溯源与算法素养定义的梳理,结合算法素养界定的核心思想,从个体与社会两个角度对算法素养内涵特点进行解读。       首先,算法素养反映的是社会技术环境对个体的能力素质要求,理解其内涵有两个关键点。①时代背景。算法素养的产生以人工智能技术发展为时代标志,是算法普遍应用与算法负面效应暴露等内外动因推动的结果。算法素养与计算机素养、数据素养等概念的核心区别在于时代的独特性。②素养本质。尽管算法素养是素养在人工智能时代的革新,但它与信息素养、数据素养等概念一脉相承,从本质上看仍属于人类素质能力范畴,对算法素养的研究也应以人为核心展开。       其次,算法素养是内化于个体的能力集合,涵盖意识、技能、知识等多个方面。从个体的角度理解算法素养有三个关键点。①面向问题解决。算法素养的核心价值是增强个体对技术环境的适应能力,适应技术环境则要求个体能够使用算法及关联技术工具解决具体问题。②感知并理解以算法为核心驱动力的社会。算法素养要求个体能够感知社会发展中的驱动力变更,并将个人作为这一变更的参与者,共同参与到算法决策和管理中。③辩证理解算法价值。算法素养需要个体全面理解算法应用的价值及其对社会经济、政治、文化的影响,包括积极影响和消极影响。      人工智能技术改变了社会驱动结构,也在一定程度上推动着社会价值和文化观念的转变,对身处社会环境中的“人”也提出了新的能力素质要求。20世纪70年代为应对计算机技术发展,学者们将目光聚焦于信息素养,围绕个人信息处理的意识、能力开展研究。而今以算法为支撑的人工智能时代也为素养研究带来了机遇与挑战。尽管算法素养仍是一个探索中的概念,但随着算法对社会发展的作用日益凸显,应当尽早关注其带来的技术鸿沟与社会风险,算法素养极有可能成为新的突破口。

    发布时间: 2024-10-31

  • 7. IFLA:人工智能对图书馆的影响及图书馆应对策略
    杨小芳
    人工智能对图书馆的影响 人工智能可能对图书馆工作产生“广泛而深刻”的影响。 从下表1中我们可以看到,人工智能对图书馆诸多服务产生影响,有些带来根本性的改变,有些只带来微小的变化。预计图书馆将以符合现有角色、与用户需求紧密相关或需要最少资源的方式来应用人工智能。 表 1 人工智能对图书馆运营的影响 我们已经强调了描述性人工智能与提高图书馆馆藏可访问性之间的紧密联系。人工智能技术被应用于生成初始元数据,此技术有望在搜索引擎中发挥作用,并助力综述的某些环节(如结果筛选)。 随着越来越多的学者在研究中使用人工智能技术,对数据科学家社区的支持需求也将增长。图书馆可以在数据发现、版权问题、数据管理和数据保存方面提供支持。 人工智能可能会改变日常的知识工作,例如自动翻译、摘要和文本生成。大量人工智能工具和应用程序可以应用于图书馆专业工作。例如ResearchRabbit、Scite、elicit和openread等工具有助于文献综述。生成式人工智能在图书馆宣传中得到了应用,因为其具备根据特定受众需求调整文本的能力。 因为人工智能能够准确执行复杂的常规性任务,故而具备了在图书馆后端系统中应用的可能。例如,采用机器人流程自动化(RPA)技术处理书目数据,便是一个典型的应用场景。 鉴于图书馆接受的咨询量大,图书馆已倡导采用聊天机器人多年。聊天机器人因为其技术障碍降低而变得可行。聊天机器人可承担如下职责: 回应常规问题 收集用户信息  遵循标准流程提供用户支持 成为新用户的伙伴 人工智能技术将被应用于打造更智能的图书馆空间。一些图书馆已研发了实体机器人用于读者咨询,机器人还被用于执行上架和盘点等任务。此外,已有图书馆采用自动存储与检索系统(ASRS),可以根据需求检索馆藏。通常,此类应用需开展大规模的重建工程。 对于学校图书馆而言,其他人工智能在教育领域的应用,如自适应学习内容创建或聊天机器人等,皆与其相关。(Jisc,2023b)。 因用户的广泛使用,生成式人工智能成为了讨论的焦点,这使得教职员工和学生需要具备一定的人工智能素养(包括数据和算法素养)。图书馆有责任推广信息素养和数字技能。人工智能素养涵盖对人工智能各种表现形式的理解,涉及“批判性评估人工智能技术;与人工智能进行有效沟通与协作;以及在网络、家庭和工作场合运用人工智能作为工具”(Long and Magerko,2020)。 人工智能素养在未来职场中显得至关重要;运用人工智能或与其协同工作的技能案例不断涌现;而其具体实施方式可能因不同学科领域而有所差异。 人工智能也可以应用于预测用户行为模式,从而辅助决策制定。 下表调查结果显示了在撰写本文时的AI发展水平。人工智能素养已迅速成为关注的焦点。(编者注:此为根据111份样本调查数据的结果;受访者包括高等教育和继续教育图书馆员,主要来自英国。) 表 2 图书馆计划中、试点和成熟应用的人工智能服务 如何更新资料以跟上人工智能不断变化的特性? 哪些应用需求资源最少且最符合用户需求和现有图书馆角色? 哪些发展对重塑图书馆角色最为关键? 哪些最有可能发生,在多长时间内发生? 人工智能技术如何提升图书馆服务?人工智能能帮助解决哪些挑战?潜在的风险和伦理考虑是什么,如何减轻这些风险? 如何持续关注并及时了解新兴的人工智能的趋势和进展? 图书馆如何有效地培养用户人工智能素养? 需要哪些关键的学习成果,在各个学科中的差异性如何? 随着人工智能发生变化,教材应如何更新? 三个重要策略 鉴于人工智能影响的广泛性,图书馆可以采取多种策略以应对。 以下列举三项重要策略建议。 策略一:利用图书馆的AI能力,构建负责任且可解释的描述性AI应用 在拥有大量需要改进资源描述的特色馆藏的情况下,图书馆可以应用描述性AI来创建符合伦理、负责任和可解释的AI的范例,以对抗大科技公司的产品((Lee, 2023; Padilla et al., 2023)。这可以通过遵循良好治理原则来实现,比如: 揭示馆藏的来源,以便使用者全面了解信息来源的性质; 确保应用人工智能的馆藏选择是适当的,考虑到技术和版权问题,同时尊重包容性、土著权利和非殖民化问题;尊重那些在收藏中被代表的人以及所有其他利益相关者的权利;适当奖励/认可志愿者和众包工作者;尊重知识产权问题,例如藏品中的版权/内容许可; 使服务对目标用户易于使用、可访问且可解释; 充分记录项目以确保可解释性; 尽可能公开地共享代码、训练数据、工具包等; 从可持续性角度评估项目,包括环境影响的角度 实现这一目标仍然存在许多挑战,例如如何: 考虑优先应用人工智能的馆藏 评估经济可承受的现成工具是否适用于图书馆馆藏历史数据 解决概念性挑战,例如如何对图像进行分类 将概念验证项目转化为可持续服务 策略二:利用图书馆员的数据能力增强组织的AI能力 并非所有图书馆都拥有需要使用人工智能的馆藏,但图书馆员在的数据相关领域的专长对于机构应用人工智能具有较高价值,因为当今的人工智能是数据驱动的。 这种专业知识可以支持图书馆所在的更广泛组织内的数据科学家,如学术环境中的多学科社区数据科学家,或在卫生服务或政府机构分析数据的分析师。相关行为包括: 在复杂的信息环境中寻找数据源 推广数据共享、开放性和互操作性的价值 解释数据来源、有效性和质量的重要性,以了解如何适当使用该数据 根据版权、知识产权等解释哪些数据可以使用,哪些不可以 使用标准描述数据及其价值 存储、保存(或销毁)数据 所有这些做法都符合信息治理和管理的专业知识,但需要将这些知识转化到数据领域。 策略三:推广人工智能素养以提升组织和社会的AI能力 在推广人工智能素养方面发挥领导作用,是最符合现有图书馆实践和图书馆员身份的策略,特别是在大学、学校和公共图书馆中。人们普遍认识到,公众作为公民和从业者需要了解新技术。各个专业的学生都需要这样的知识来提高就业能力。 图书馆员已经开发了信息素养项目,人工智能某些方面素养可以纳入其中。他们已经发展了所需的教学知识和技能。 人工智能素养可能包括识别人工智能何时被使用的能力;理解狭义人工智能和通用人工智能之间的差异;了解人工智能擅长解决哪些类型的问题;了解机器学习模型如何训练。另外还包括对诸如偏见、隐私、可解释性和社会影响等伦理问题的认识。 由于人工智能基于数据,因此数据素养被认为是人工智能素养的组成部分。算法素养是一个已经发展起来的概念,用于描述搜索和推荐等服务如何越来越多地由算法塑造,以使内容个性化,但也可能限制信息的可见性并产生信息茧房效应。更正式地说,它被定义为“了解在线应用、平台和服务中算法的使用,了解算法的工作原理,能够批判性地评估算法决策,以及拥有应对甚至影响算法操作的技能”(Dogruel et al, 2022: p.4)。将算法素养扩展到搜索范畴之外与人工智能素养相关。 人工智能很复杂且难以解释。它有多种应用和形态。它基于难以理解的计算思想和统计数据。通常即使是人工智能的设计者也难以理解人工智能作出的决策结果,因为机器从数据中学习模式。虽然一些人工智能的形象让我们期望去使用一个明确的AI服务(如ChatGPT),但实际上它通常嵌入在基础设施中,不容易识别或抵制。的确,可以公平地说,大型科技公司不一定希望人工智能的工作方式为人所知,因为这是商业机密。

    发布时间: 2024-10-31

  • 8. 数智化图书情报监测快报
    数图
    数智”赋能正逐步成为推动图书情报领域创新发展的新动力,大数据+人工智能等新技术为图书情报领域发展带来了新机遇,数智化图书情报监测快报聚焦大数据、人工智能等技术在图书情报领域应用现状,跟踪最新研究成果,为领域研究人员提供信息支撑。

    发布时间: 2023-11-29

  • 9. ChatGPT赋能图书馆虚拟数字人:技术优势、应用场景与实践路径
    程冰
    虚拟数字人是一种利用计算机技术、人工智能技术和图像学技术的人形虚拟实体,其外部形象和外显行为是通过在虚拟现实环境中使用机器学习、语言生成、模拟对话等数字化技术来模拟真实世界人物的行为来生成的。其具有高度的可定制性、自主和自适应的学习能力、逼真的外貌形象和动作表现、自然而流畅的交互方式以及高效的算力效率等特征。为了实现虚拟数字人的“拟人化”,需要使用模型驱动技术赋予其与人相似的特征。这些驱动技术主要包括三种:第一个是图像迁移技术,也称 CG 建模技术,利用计算机技术进行视觉设计和生产,使虚拟数字人的外观更真实拟人;第二个是自然语言处理技术,训练虚拟数字人的语言对话能力,使虚拟机器人和用户的对话更加人性 化;第三个是 CV 等深度学习模型,通过大量的原始数据训练虚拟数字人,使其不断进行自我进化,完善计量框架等,进一步丰富虚拟数字人的“灵魂”。 虚拟数字人近年来备受关注,作为一种新兴的技术,其在商业活动、文化教育、智慧城市等众多领域发挥作用,图书馆也是虚拟数字人的重要应用场景。在图书馆服务中,虚拟数字人可被视作一种新的交互媒介,其能够模拟和再现真实世界中的各种人类活动和行为,并创造出一些超越现实的全新体验和知识。在元宇宙领域,虚拟数字人作为一种集数据赋权、智能化决策、实时互动、非线性组合和多源交互于一体的新型决策主体,有助于形成特定感知、响应、协调的新型敏捷治理路径。虚拟数字人也是元宇宙中的数字记忆主体,有助于图书馆等文化记忆机构参与构建、长期保存数字记忆和进行服务创新。有学者提出,图书馆有必要将普通虚拟形象升级为虚拟数字人开展服务。 ChatGPT 一经问世便引起信息资源管理领域学者的广泛关注。陆伟等提出,ChatGPT 在支撑算法与技术、信息资源建设、信息组织与信息检索、信息治理、内容安全与评价、人机智能交互与协同等方面都具有深远的影响。目前,ChatGPT 在图书馆领域的应用研究主要集中在以下三个方面:一是智能问答系统,围绕 ChatGPT 的生成能力,快速、准确地回答用户提出的问题,为用户提供更加智能化的服务;二是虚拟助手,通过 ChatGPT 提供更加贴近用户需求的服务,不断优化自身的服务质量,提高用户满意度;三是文献推荐系统,通过分析用户的阅读记录和兴趣偏好,自动生成与用户兴趣相关的文献推荐,提高用户的阅读体验和阅读效率。ChatGPT 的出现为图书馆人智交互提供了更加高效、准确、自然的解决方案,为图书馆的未来发展提供了新的思路和方向。 ChatGPT 在自然语言处理领域取得了显著成果,可实现拟人化交互和更高效地向虚拟个体提供技术基础。ChatGPT 赋能虚拟数字人的相关探索主要有以下几个方向:第一,通过对 ChatGPT 进行微调,使其能够生成更符合人类交互习惯的自然语言,从而使虚拟数字人的语言生成更加自然流畅。同时,将语义理解的知识引入,让虚拟数字人能够更加准确地理解用户的意图,提升交互质量。第二,学者们通过对 ChatGPT进行情感训练,使其能够识别和表达不同情感状态下的语言和行为,从而使虚拟数字人更真实地表现出情感,并能够进行情感识别和反馈。第三,在虚拟数字人的多模态交互方面,学者们将 ChatGPT 与图像、声音等多模态信息进行融合,例如与人脸识别技术相结合,虚拟数字人能够精准识别用户的表情,以理解用户意图并为其提供相应服务。 ChatGPT 赋能虚拟数字人在图书馆领域具有重要的价值和意义,是提升图书馆服务水平、优化服务效率以及推动服务模式创新的必要选择,也是适应信息化时代发展趋势的重要举措。本研究聚焦于 ChatGPT 在图书馆虚拟数字人领域的应用,着重探讨其技术优势、应用场景和实践路径,以更好地推动智慧图书馆的建设和发展。具体来说,ChatGPT 赋能虚拟数字人的优势包括高效的智能模型计算、精准的信息资源服务和人性化的自然语言交互。在应用场景方面,ChatGPT 可以被用于虚拟馆员智能问答、虚拟讲解员、阅读推广服务以及特殊人群无障碍服务等方面。针对这些应用场景,本研究从技术支撑、信息资源、服务场景和管理制度方面提出实践路径,明确图书馆虚拟数字人服务治理发展方向,充分利用 ChatGPT 技术去整合、搜集、加工和应用资源,以实现ChatGPT 赋能图书馆虚拟数字人技术的全面应用。 近年来,人工智能以及元宇宙的快速发展和广泛应用不仅深刻改变了我们的生产和生活方式,也为图书馆事业带来前所未有的机遇和挑战。本文在 hatGPT 赋能图书馆虚拟数字人的技术优势、应用场景与实践路径方面进行了初步的探索,在未来更深入的研究中,将借助 ChatGPT 的插件,构建图书馆虚拟数字人原型系统,探索系统的数据支持、可行性验证和效果评估。通过数字技术和人工智能技术的结合,图书馆虚拟数字人将实现从传统服务模式向智慧化服务模式的跨越,为用户提供更高质、更高效的服务。这也为图书馆学界提供了新的研究支点,共同开创数智融合下图书馆虚拟数字人新进路。 [1]郭亚军,庞义伟,周家华等.ChatGPT赋能图书馆虚拟数字人:技术优势、应用场景与实践路径[J/OL].图书馆论坛:1-11[2023-07-11].

    发布时间: 2023-07-11

  • 10. 数据与知识双驱动的知识组织系统构建框架研究
    闫亚飞
           知识组织系统(KOS)反映领域知识的概念及概念关系,是描述、表示特定领域的知识而生成的语义工具,涵盖了从简单的术语表到包含语义关系的规范档、受控词表、本体等。 知识组织系统的构建方式与计算机技术的发展相呼应。早期知识组织系统的构建主要依赖于专家先验知识,具有严格受控、权威性、全局性等优势。但纯粹依赖专家构建的知识组织系 统具有不可忽视的缺陷:一是主观性强,多依赖于专家先验知识,缺乏对终端用户需求的客观反映;二是实时性不强,知识组织系统构建后处于封闭静止状态,其无法通过自主学习进 行知识动态更新,术语经过长期实践积累达到一定规模后,才会由专家进一步更新,因此知识组织系统的概念更新缓慢,具有滞后性;三是成本较高,严格受控的概念选取及层次结构 建设使手工构建知识组织系统耗时耗力。大数据环境下实时更新的数据资源有待挖掘以提供各种智能化决策,其为知识组织系统提供了丰富的语料,自动构建知识组织系统成为可能, 通过对多源海量数据的自动采集、加工、处理、分析、整合和提炼,抽象形成具有一定结构的概念知识体系,但自动构建的方式依然有一定的局限性:一是机器语义理解差,从海量数 据中挖掘其结构,生成达到一定语义规范的概念存在困难;二是知识组织系统具有严格受控的多层次结构,机器学习技术仍难以自动化识别概念之间的丰富语义关系,建立语义关联且 形成符合用户需求的概念层级结构仍需人工干预;三是对数据质量要求高,自动化构建的知识组织系统高度依赖于所采集的涵盖主题领域的数据样本,数据的质量决定了最终形成概念 体系的质量。当前数据与知识相结合的第三代人工智能的出现,旨在将专家知识与海量数据有机结合,提升数据处理效率和质量。 如何借此契机,探索知识组织系统新的构建方式将成为当前知识组织领域的重要问题。         文章在分析国内外研究现状的基础上,从理论层面深度剖析数据和知识的协同机制,应用符 号学理论分析“数据”与“知识”之间的双向转换关系,并从知识组织系统的语法、语义、 语用角度,提出数据与知识双驱动的知识组织系统构建框架,有助于厘清数据与知识的双向转化,突破现有知识组织系统构建方法存在的局限,实现两种构建方法的深度融合及优势互 补,为数智时代自动构建高质量、高效率的知识组织系统提供新的路径。       知识分为隐性和显性两种类型。隐性知识是通过经验、行动、主观的洞察力等嵌入人类头脑中,难以正式表达、沟通或分享的知识;显式知识是可以正式表达、共享、复制、存储 的知识,更具有实用价值。知识管理中这两类知识通过相互转换而实现价值,但转换过程离不开数据支持。海量数据中蕴含着有待被挖掘的一定量的显隐性知识,经过分析、加工、 提炼等形成可表达的显性知识,服务于具体应用场景,进而产生新的数据,如此不断反复。如何从海量“数据”中获取、提炼、转换为有用的“知识”,“知识”又如何物化成可计算 的“数据”是实现数据与知识两者有效转换的关键。数据到知识的转化过程一直都是信息管理、信息系统、计算机领域等多个学科或领域关 注的热点话题。数据本身是观察的产物,存在于人类的思维之外,没有任何意义,定义为 表示对象、事件及环境的属性的符号。美国哲学家皮尔斯(Pierce)的符号学理论指出符 号由三个相互关联的基本要素组成:符号形体(Representamen)、对象(Object)和解释 项(Interpretant),其中符号形体可视为一种指代,对象是由符号所指的客观存在,解释项是人对符号与物体之间联系的理解和反应。由此看出,当认知主体对客观物理世界 进行感知时,从而为客观对象赋予了能够表征它的符号,即形成了多样化数据。而符号的含 义则是由主体所认知的知识来反映,此时知识成为提供符号意义的解释项,体现了对客观世界的理解和反映,使人们能够共享符号及符号语义以实现无障碍交流。知识由认知主体对客 观世界中数据(符号)的理解和反映而形成,通过对数据一系列组织和处理分析,形成对当前问题或活动的解释、理解及经验。数据密集型社会带来了数据量的激增,借助于统计学、 机器学习等技术,对海量数据进行提炼总结形成知识,数据到知识的转换效率提升。 知识向数据的转化是一个反向过程,当知识被语法、语义等结构描述后成为信息,信息被详细定义的数据结构规范后成为数据。数据是可被计算的符号,知识为数据符号提供 了语义解释。知识转化为数据就是将知识描述为可被计算的形式化结构,应用到数据处理环节中,以提升数据处理的效率。不断增加的知识同样面临序化表示的问题,知识组织系统作 为重要的工具,以知识为主要描述对象,对知识进行表示、描述、共享和使用,从而为符号所表达的语义意义提供明确的概念共识。正如 Qin Jian指出,知识组织系统实际上是将 人类对世界理解所形成的知识组织成各种系统或工具,以推动知识的再利用与创造。知识向数据转化过程需要各种知识组织系统的参与,通过对知识进行显性化、表示和存储,以更好 用以解释数据含义。 数据与知识的双向转化形成了一个联动的持续循环过程。依据波普尔“三 个世界”理论,上层表示物理世界,指代一切物质客体;中层表示精神世界;下层表示客观知识世界,凸显认知主体对客观世界中实体对象的感知和反映。物理世界产生了大规模的 实体对象,催生了用于指代实体对象的海量数据。数据作为认知主体给予对象的识别符号,数据的激增促进了认知主体对新的解释项的产生和扩充,进一步提升了对知识本身处理的需 求,推动知识组织系统的不断发展及应用。从海量数据中获取知识,以知识组织系统方式表示,并将知识组织系统应用到数据处理中,这样不仅推动数据与知识转换及增值,而且能够 动态反映外部客观世界变化,实现数据与知识从静态化向动态化管理。

    发布时间: 2023-07-11

  • 11. Nature重磅:Google DeepMind推出AlphaDev,可自主构建C++排序算法,或将加速全球计算
    黄雨馨
    数字社会对计算和能源的需求正在不断增加。在过去的五十年中,人类主要依靠硬件层面的改进来满足这一点。然而,随着微芯片接近其物理极限,改进运行在其上的代码以使计算更强大和可持续也变得至关重要。 对于每天运行数万亿次的算法而言,这一点尤为重要。因为它们支撑着从在线搜索结果和社交帖子的排名到计算机和手机上数据处理的一切。 如今,Google DeepMind 推出了 AlphaDev,一种利用强化学习来发现改进的计算机科学算法的人工智能系统,其自主构建的算法,超越了科学家和工程师几十年来打磨出来的算法,将一种每天在世界各地使用数万亿次的 C++ 算法的运行速度提高了 70%。 相关研究论文以“Faster sorting algorithms discovered using deep reinforcement learning”为题,已发表在权威科学期刊 Nature 上。 “说实话,我们没有想到会取得更好的成绩:这是一个非常短的程序,这些类型的程序已经被研究了几十年,” 论文的第一作者、Google DeepMind 的研究科学家 Daniel Mankowitz 说道。 Google DeepMind 表示,他们已经将该算法纳入常用的 Libc++ 库,这是十多年来对这部分排序算法库的首次修改。这意味着,全球数百万开发人员和公司现在可以将其用于从云计算和在线购物到供应链管理的人工智能应用中。 MIT 教授、CSAIL 首席运营官 Armando Solar-Lezama 在评论文章中写道,“也许更值得注意的是,人工智能系统可以在不了解问题本身的情况下改进代码。” 通过游戏找到最佳算法 利用人工智能生成更好的算法,将改变我们编程的方式,影响我们日益数字化的社会的各个方面。 排序算法是世界各地的计算机不断使用的基本功能,因此,由人工智能创造的改进算法可以使数百万程序运行得更快。 据介绍,AlphaDev 基于 AlphaZero(一种强化学习模型,在围棋、国际象棋等游戏中击败了世界冠军),通过 AlphaDev,Google DeepMind 展示了这个模型如何从游戏转移到科学挑战,并从模拟转向现实世界的应用。 为了训练 AlphaDev 来发现新算法,DeepMind 将排序转化为一个单人“汇编游戏”。在每个回合,AlphaDev 都会观察它生成的算法和 CPU 中包含的信息。然后,它通过选择一条指令来为算法添加一步行动。 这个汇编游戏非常困难,因为 AlphaDev 必须有效地搜索大量可能的指令组合,以找到一种比当前最佳算法更快的排序算法。可能的指令组合的数量与宇宙中的粒子数量或国际象棋和围棋中可能的行动组合数量相似,一次错误的行动就可能会导致整个算法无效。 在构建算法时,AlphaDev 逐步添加一条指令,并通过将算法的输出与期望结果进行比较来验证其正确性。对于排序算法来说,这意味着无序的数字输入,正确排序的数字输出。Google DeepMind 根据 AlphaDev 正确排序数字的能力以及完成排序的速度和效率来奖励它。AlphaDev 通过发现一个正确且更快的程序来赢得游戏。 最终,AlphaDev 构建了一个新算法,对于 5 个数据的列表,它比最好的算法快 70%,对于超过 25 万个项目的列表,它比最好的算法快 1.7%。 “我们最初以为它犯了一个错误,或者有一个 bug 或其他东西,但是,当我们分析这个程序时,我们意识到 AlphaDev 实际上已经发现了更快的东西,”Mankowitz 说。 Mankowitz 表示,“优化每天被调用数万亿次的基本函数的代码,有望带来足够大的好处,鼓励人们尝试执行更多这些函数,并将其作为解决摩尔定律放缓瓶颈的途径之一。” 对此,英国伯明翰大学教授 Mark Lee 认为,AlphaDev 很有意思,即使是 1.7% 的速度提升也很有用。但他也认为,即使在其他普通算法中发现类似的效率,也不能确定这种方法真的可以弥补摩尔定律的瓶颈,因为它不能在更复杂的软件中取得同样的收益。 构建通用人工智能工具的重要一步 目前,Google DeepMind 正在探索 AlphaDev 在 C++ 等高级语言中直接优化算法的能力,这对于开发人员来说将更加有用。 Google DeepMind 在官方博客中写道,“通过优化和推出全球开发人员使用的改进排序和哈希算法,AlphaDev 展示了其具有真实世界影响的泛化和发现新算法的能力。我们将 AlphaDev 视为发展通用人工智能工具的一步,这些工具可以帮助优化整个计算生态系统,并解决其他有益于社会的问题。”

    发布时间: 2023-07-11

  • 12. 第六届世界媒体峰会:人工智能与媒体变革
    程冰
    2024年10月12日至17日,第六届世界媒体峰会在新疆乌鲁木齐举行。本次为期6天的峰会聚焦“人工智能与媒体变革”主题,分析了人工智能技术快速发展给世界传媒业带来的机遇和挑战,探讨媒体在新一轮科技革命和产业变革中的角色和责任,共商如何更好讲好世界现代化建设的故事,推动全球共同发展。 随着人工智能技术的突飞猛进,我们正在经历一场内容创作、分发和消费方式的革命性变革。将新技术及时融入媒体工作不仅是时代的要求,也是媒体行业受众的需求。在图像和语音识别、自然语言处理等关键领域,人工智能的应用为媒体行业带来了前所未有的创新工具和表现形式。 然而,随着技术的不断深入,我们也面临着一系列新的挑战。数据隐私保护成为一个亟待解决的问题,因为人工智能系统需要大量用户数据来优化其算法,这可能引发用户对个人隐私泄露的担忧。信息的真实性验证也变得越来越重要,因为人工智能技术同样可以被用来制造逼真的假新闻和深度伪造视频,这对社会的信任体系构成了威胁。虽然人工智能存在黑箱、算法偏见、伦理治理等问题,会给社会带来挑战,但是纵观科技发展,人工智能等新兴技术会为我们的社会构筑新底座、定义新范式、探索新方式。 此外,机器与人类工作者之间的协作关系也变得复杂,人工智能的广泛应用可能会改变工作性质,引发就业市场的动荡。同时,此次会议也成为新疆一段时间以来对外发声的平台,新疆维吾尔自治区党委书记马兴瑞在开幕式上致辞并表示,此次峰会既是全球传媒界的盛大聚会,也是实地了解中国新疆的重要窗口。最后,新华通讯社副社长发布了《第六届世界媒体峰会新疆共识》。共识强调,人工智能治理攸关全人类命运,是世界各国面临的共同课题,迫切需要深入探讨,凝聚共识,共抓机遇,共克挑战;全球媒体应当合理运用人工智能新技术,讲好人工智能赋能可持续发展故事,推动人工智能更好服务全球发展、增进人类福祉;面对人工智能技术快速发展的时代下,应始终坚持新闻伦理和专业标准向受众传播真实、客观、全面、公正的新闻消息。我们相信,本次世界媒体峰会将促进全球媒体凝聚广泛共识、深化交流合作,助推世界各国共享人工智能发展成果,同行高质量发展之路,为推动构建人类命运共同体、建设更加美好世界汇聚强大媒体力量。

    发布时间: 2024-10-31

  • 13. 不负“一流”使命 闯出科技期刊中国道路
    杨小芳
    一部科技期刊史,见证壮阔科技史。自1665年英国皇家学会创办世界上第一本科技期刊《哲学汇刊》以来,科技期刊便成为科技大事件的重要推手,世界一流科技期刊更直接体现国家科技竞争力和文化软实力。 正因为如此,着力打造世界一流科技期刊,被置于创新型国家建设的突出位置。 建设世界一流科技期刊,引领我国科技期刊由大向强,我们的“底子”如何,“底气”何在,具备怎样的“底蕴”,又该如何加固“底层”?科技日报记者为此进行了深入采访。 底子:世界科技期刊前列增添许多中国身影 “我国已成为期刊大国,但缺乏有影响力的世界一流科技期刊。”这是2019年中国科协、中宣部、教育部、科技部联合印发的《关于深化改革 培育世界一流科技期刊的意见》(以下简称《意见》)在开篇语里作出的判断。 随着几年来的实践,人们已经发现,世界科技期刊前列增添了许多中国身影。数据分析公司科睿唯安2023年公布的《期刊引证报告》(JCR)显示,中国期刊《细胞研究》影响因子达到44.1,蝉联世界影响因子百强期刊。《电化学能源评论》《分子植物》《园艺研究》《先进陶瓷》等多个中国科技期刊位居本学科领域影响因子全球第一。近几年SCI收录的期刊总量增长了不到4%,而中国进入SCI期刊数量增长了25%。 然而,这是不是意味着我们离建设世界一流科技期刊已经不远了呢? “世界一流期刊必须是能够持续、集中地刊登某一个学科或多个学科的具有世界一流水准的科研成果的载体,其论文必须对学术、技术、产业等某个方面或某几个方面产生重大影响,能够引领某个领域,甚至对人类的进步、社会的发展产生较大影响。”凝聚态物理学家、中国科学院院士朱邦芬曾对世界一流期刊的内涵和外延作出这样的表述。就客观情况看,我国的科技期刊在“重大影响”和“较大影响”方面还有不小的差距。 据《中国科技期刊发展蓝皮书(2023)》(以下简称《蓝皮书》)统计,2022年中国作者发表SCI论文总数,是中国SCI期刊发表论文数的19倍多。这意味着大量中国作者的成果发表需要依靠海外科技期刊,我国科技期刊对一流成果的承载能力还远远不够。 同时,《蓝皮书》也显示了当前我国科技期刊出版“小而散”的处境。截至2022年底,中国科技期刊总量为5163种,分属于3218个主办单位。77.13%的主办单位仅主办1种科技期刊。这些飘散四处的星星之火,尚需汇聚以成燎原之力。 如今,在国际上,科技期刊向大型出版机构集中已成明显趋势。为了提升市场占有率,国际大型出版机构不断强化集群化发展。以施普林格·自然集团为例,截至2022年,其旗下的《自然》子刊就有65种,几乎覆盖了所有的学科领域,同时还以每年3种子刊的速度扩张。 近年来,我国科技期刊的集群发展在平台加持下已显加速之势。截至2023年,中国科学院主管主办期刊已达到400余种,自有的SciEngine平台技术建设和资源集聚初具规模,包含近450种期刊、39万余篇论文,总下载量超过3800万次。中华医学杂志社搭建运营的“中国临床案例成果数据库”已覆盖来自全球30余个国家的读者。 建设世界一流科技期刊群,还期待更多“高原”的崛起,教育部科技委学风建设与科学传播专门委员会委员、中国高校科技期刊研究会理事长张铁明说:“目前国内的科技期刊建设滞后于高水平科技自立自强,期刊对于国家科技创新的支撑和服务作用还有很大差距,这也是期刊人正在努力改变的现状。” 底气:中国已经具有国际一流的稿件源和作者群 2022年,我国全社会研发经费支出首次突破3万亿元,研发投入强度首次突破2.5%,基础研究投入比重连续4年超过6%。夸父探日、青藏科考、微纳卫星、量子传输、质子治疗等一批重大创新成果竞相涌现……如今我国不仅是国际前沿科技创新的重要参与者,也是共同解决全球性问题的重要贡献者。 “中国已经具有国际一流的科技稿件源,这将为建设世界一流的学术期刊提供稿件源和作者群基础。”中国科学院院士、世界一流科技期刊建设专家委员会主任杨卫对此充满信心。 中国科学技术信息研究所发布的《2023年中国科技论文统计报告》显示,2023年,我国各学科最具影响力期刊论文数量首次升至世界第一,高水平国际期刊论文数量及被引用次数均排在世界第一。这表明,我国科技论文质量已经发生跃升。 面向世界科技前沿,有可裸眼观察遗传转化的植物通用性便捷报告系统;面向经济主战场,有智能网联汽车关键技术;面向国家重大需求,有降低电磁污染的新型导热屏蔽复合材料;面向人民生命健康,有针对抗新冠病毒候选药物筛选实验性研究成果……我国科技期刊正在快速抓住这些一流成果评鉴和记录的主动权。 国家对科技期刊的政策支持,带动和引导了一批科技期刊的高质量发展。进入21世纪以来,国家相关部门先后推出“精品科技期刊工程项目”“中国科技期刊国际影响力提升计划”“中国科技期刊卓越行动计划”等一系列专项财政支持项目。中国科协科学技术创新部部长刘兴平在2023年中国期刊高质量发展论坛上指出,2018至2022年,经过五年的发展,我国国际学科排名进入Q1区(前25%)的期刊增加了99种,学科排名居于前5%的增加了45种,排名学科前三的增加了28种。其中,15种期刊学科排名位居第一,4种期刊影响因子超过30,进入全球百强。 曾经“借船”出海的期刊,也在探索归国自主“造船”之路。2022年12月,多次蝉联本领域影响因子世界第一的《先进陶瓷》,结束了与施普林格·自然集团长达11年的合作,转为依托清华大学出版社自主研发的学术期刊数字化国际出版平台SciOpen。 “要办就办世界一流!不是关起门来办一流,而是到世界上争一流,这是我们共同践行的办刊理念。”清华大学出版社副总编兼期刊中心主任石磊告诉记者:“清华大学科技期刊群目前有45种期刊,出版内容已覆盖清华大学60%的‘双一流’学科,在信息科学、纳米科学等领域已经形成一定的出版规模、品牌特色和国际影响力。我们要把内容集群化和平台智能化结合起来,努力为国家高水平基础科学支撑平台和开放创新生态体系建设作出更多贡献。” 一流学科、一流期刊和一流科学家,正在形成协同发展的纽带关系。“中国海洋大学拥有12个ESI前1%的学科,每个学科领域在我校海洋特色学术期刊群中,都有至少2种学术期刊提供学术支撑,形成了特色优势学科与学术期刊融合发展、相互支撑的关系。”中国海洋大学期刊社社长杨立敏介绍道,正是这样的“通力合作”,才使得创办《海洋生命科学与技术(英文)》4年来,影响因子就达到5.7,在海洋与淡水生物学领域全球排名第五。 来自湘江两岸的例子也可以成为印证。中南大学拥有世界上最完备的“地采选冶材”有色金属学科体系链。翻开其《中国有色金属学报》的红色封面,一页长长的编委名单映入眼帘。 “创刊至今的32年时间里,这份名单中已经产生很多院士。现在,我国有色金属行业的院士几乎都在这份名单上。世界一流的学科群和科学家,给了我们建设世界一流科技期刊的底气。”中南大学出版社副社长杨保华说。 底蕴:中国科技期刊正处于科技回答时代之问的重要时期 1898年,居里夫妇发现了新元素钋,两人合写了论文《论沥青铀矿中所含的放射性新物质》。他们在投给法国科学院《论文汇编》发表之前,就已经把原稿寄回祖国,用波兰文发表在华沙的画报月刊《斯维阿特罗》上,让她的同胞能第一时间看到成果。 1926年,清华国学研究院和美国弗利尔艺术馆,就李济、袁复礼主持的山西夏县西阴村田野考古发掘达成协议,约定论文要用中英文撰写并在中美两国学术刊物上发表,这在当时难能可贵。科学家对祖国的热爱深深地投射在世界一流科技成果上,科学家精神深嵌在科技期刊的骨子里,今天依然在赓续。 港珠澳大桥已开通5年,不仅为粤港澳大湾区的互联互通奠定基础,更创造出世界工程技术领域多个第一。“聚焦高铁、桥梁等‘中国超级工程’的学术论文,或许引用率不是很高,但它记载了我国一线科技工作者的创新成果和研究进展,解决了一些世界性难题,国际上是非常关注的。”杨保华告诉记者。 “立足国情、面向世界,提升质量、超越一流。”翻开《意见》,第一部分写着这样16个字。当科技发展正在回答时代之问,科技期刊又该怎样呈现?科技期刊能否从成果发布交流平台升级为支撑国家科技创新的基础性平台? 近年来,中国科学院分子植物科学卓越创新中心主办的《分子植物》正在尝试把中国的科研成果和中国元素共同制作成杂志封面,推动中国的科研成果和文化同时走向世界。《中国科学院院刊》作为中国科学院高端智库的“名片”,为中国科学院的发展、国家宏观战略与决策的制定发挥了导向和支撑作用。《航空学报》走进一线科研机构,围绕“卡脖子”技术策划出版“大飞机专刊”“空间机器人专刊”等几十个重磅专刊或专栏,获得业界高度认可。《清华大学学报(自然科学版)》组织了“港珠澳大桥”“智能建造——白鹤滩、乌东德水电站”“天眼(FAST)运行维护中的关键技术”等专题或专刊,探索高校学报“开门办刊”之路。《煤炭科学技术》走进国家能源集团、山东能源集团等生产一线,开展煤炭科技大讲堂、科技论文写作培训活动100余次,助力生产一线科技成果产出…… 世界一流科技期刊建设的中国道路正在慢慢铺就,也牵动着更多思考。中国科学院院士、古鸟类学家周忠和研究员在《科学通报》刊文指出,在比较长的一段时间内,中文、英文期刊各自承载不同功能,应当明确自身定位,并充分考虑哪些具体研究具有区域、文化的独特性。 杨保华认为,科研工作坚持“四个面向”,我国科学家解决的很多本土问题都是世界性难题。期刊核心竞争力应该由其发表论文的原创性、创新性、前沿性决定,而不是由语种和国别决定,这是我国中文和英文科技期刊都应该保持的态度和定力。 中国科学院自然科学期刊编辑研究会秘书长刘筱敏告诉记者,开放、交流是科学与生俱来的本质属性和文化基因。数字技术的发展提供了更多方法可以跨越语言障碍。我国中文和英文期刊都需要进一步增强对国内外学者的吸附能力,汇聚更多优秀科研成果,健全自主可控的学术交流渠道,进行全球范围的传播,让科研成果惠及全球发展。 “我国的科技期刊已经取得了很大成绩,但比起我们所肩负的历史使命、时代使命、科学使命、国家使命,还是任重而道远。”在2023上海科技期刊高质量发展大会院士圆桌会议上,中国科学院院士、《细胞研究》前主编裴钢谈道。 底层:同向发力不断夯实建设世界一流科技期刊的基础 记者在采访时,多位期刊界人士谈了自己的体会:建设世界一流科技期刊,当务之急是提高期刊的编辑素养和编辑的科技专业水平;基础是一流人才支撑和动能激励机制;关键是创新前沿关注和选题视野;重心是科学表达和平台传播;要害是评价的专业性和影响力;本质是创新成果的引领力和论文发表的吸附力。 中国科协学会服务中心提供的数据显示,2022年,我国442种英文科技期刊中,403种依赖海外平台出版。“单刊与国际出版集团合作,大多处于依附地位,在研发、销售等高附加值环节没有主动权,难以获得规模化发展效益。”有科期刊出版(北京)有限公司董事长钱九红坦言。 “单纯靠逐步创办新刊来增加办刊数量的方式效率低、成本高,难以实现快速规模化发展的目的。”她建议,“加强顶层设计,从国家层面推动科技期刊的集团化、集约化发展,加大对出版单位集群化、集团化发展的政策支持,鼓励跨地域、跨部门办刊,支持期刊出版单位找准定位,探索构建资源深度融合发展的创新模式。” “好的机制创新,就会让道路走得更宽阔一些。”《园艺研究》主编程宗明建议,一流科技期刊培养编辑人才不仅需要期刊发挥能动性,更重要的是健全的激励机制和广阔的成长空间,让期刊编辑人员更有归属感。同时,中国科技期刊要兼顾学术声誉和商业价值。此外,他期待能够提高我国科技期刊在科研成果评价中的应用。 《园艺研究》自2018年起,开始尝试利用社交媒体建设学术社区,打造建立在高质量期刊基础上的学术生态圈。5年后的今天,该期刊已经建成一批成熟的学术交流社群,通过学术交流社群招募云实习编辑等举措,探索逐步引导科研人员从“读者—作者—协同工作人员”的身份转变和流动。 “我们编辑部6个人,做着3本刊物。人手紧张,我们就创新机制,吸引大家自建自治。”程宗明介绍。 中华医学会杂志社社长魏均民一语道破当前的发展瓶颈:“优秀的期刊出版人才,尤其是复合型期刊出版人才、优秀英文编辑相对不足。”据《蓝皮书》分析,我国刊均从业人数集中在4—7人区间的期刊占45%。 我国期刊编辑往往不仅要做前端的选题策划,还要兼顾后期的宣传,从头做到尾。杨保华指出,“没有专业化的人才分工、完善的人才体系,编辑个人的专长优势就很难发挥出来”。人才是基础问题,中国科技期刊要面临的考验还很多。 在11月23日公示的2023年度卓越行动计划优秀人才案例遴选汇编项目拟入选案例中,优秀主编人选不乏梅宏、饶子和、王恩哥等中国科学院院士,记者还欣喜地看到《科学通报》《森林生态系统》《工程》等期刊的优秀管理人。卓越项目孵化的期刊人才底层架构渐成体系。 中流击水时更需“弄潮”。新时代科研范式的变革,更需期刊人从整体、开放和系统的维度共同营造期刊生态。中国高校科技期刊研究会秘书长张昕认为,加快建设世界一流科技期刊,是文化自信尤其是创新文化自信的体现,而创新文化自信正是创新型国家建设的“精气神”。据了解,于11月29日在南京召开的第十八届中国科技期刊发展论坛,将围绕“开放 信任 合作——科技期刊助力高水平科技自立自强”主题,进行深入探讨。 不负“一流”使命,在关注世界一流科技成果上闯出科技期刊中国道路。把论文写在祖国大地上,中国的科技期刊正朝着世界一流科技期刊目标蝶变。 原载于《科技日报》2023年11月29日5版(《深瞳》)

    发布时间: 2023-12-01

  • 14. 日本总务省:中国对ChatGPT等生成式AI应用,全球第一
    程冰
    日本总务省官网发布2024年(令和6年)生成式AI应用白皮书。 主要查看了日本公民对ChatGPT、Coplilot、Midjourney、Stable Difusion、Gen-2、MusicGen等10多种生成式AI的应用情况,同时对美国、中国、英国和德国的全球主流使用国家进行了横向调查和对比。 结果显示,中国以56.3%的使用率排名第一;美国46.3%排名第二;英国39.8%排名第三;德国34.6%排名第四;日本9.1%第五。在企业对生成式AI的应用方面,中国以71.2%大幅度领先同样排名第一。 这个调查结果与上周美国SAS发布的调查数据一样,也就是说中国凭借庞大的“原生数字人口”以及健康、积极的创新技术生态,在生成式AI产品场景化落地和应用方面领先美国、英国、日本等发达国家。

    发布时间: 2024-07-26

  • 15. 中国国内医学相关的类GPT语言模型
    闫亚飞
    1、华佗GPT 华佗GPT 有免费体验网站,可直接访问对话,无需注册登录账户。目前处于测试阶段,还在不断完善优化中,由香港中文大学(深圳)和深圳市大数据研究院联合开发。 是一个基于大量中文医疗语料训练的大语言模型(LLM),目的是让语言模型具有医生的专业知识和患者的友好态度,为医疗咨询场景提供便捷有效的服务。目前处于测试阶段,生成结果正确性目前没有额外机制保证,结果仅供参考,请遵医嘱。界面中有上传图片和语音按钮,但这两个功能实际效果如何还待验证。 2、左医GPT 左医医疗大语言模型 不免费,但可申请短期体验。该对话页面需要用API key,底部有API key申请平台入口,在平台通过客服或联系电话或企业微信号等多种方式申请可获得key,申请就直接给,会给一个有试用期的API密钥,在左医GPT对话页面输入即可体验。目前主要对医院等医疗相关单位机构合作使用。我上次申请体验的是有2天试用期,不知现在能试用多久。 补充:百度搜索“左医GPT”,有介绍,平台申请直接获得key,因为医疗比较严肃,所以加一道,保证使用安全。——来自本文评论区 张超(左手医生创始人 CEO) 左医GPT不是基于GPT-3的,而是基于Transforme架构的自研模型。听译机器人的底层技术用的是左医GPT,和openAI没有任何关系。可通过语音识别和自然语言理解技术,实时记录医患对话,并自动生成电子病历。还可通过语言模型和知识图谱技术,为医生提供智能辅助功能,如用药指导、诊断建议、随访管理等。左医GPT是左手医生公司的核心产品之一,目前已经部署在全国近百家头部医院,提供智慧服务。 官网产品介绍地址(可申请API key) 左手医生开放平台-助力智慧医疗服务建设 3、岐黄问道GPT 大经中医岐黄问道大模型 (dajingtcm.com) 中医大模型,大经中医出品。目前对医疗机构开放申请内测。三个子模型:基于已确诊疾病的临床诊疗大模型,仅基于症状体征的临床诊疗大模型,中医养生调理大模型。 落地应用:在“学习强国”App中的中医智能健康助手就是基于此模型,只需要选择一些不舒服的表现,就能推荐中医调理方案。广东省中医院、上海中医药大学附属龙华医院等医疗机构单位;南京市江宁区、淄博市高青县等区域中医医联体,上海长宁区“为老服务中心”,下沉到山东吉林等地村卫生室这种基层医疗机构。 训练呢数据集:1100万条中医知识图谱数据;1500本中医古籍和文献数据;10万份真实中医专家医案数据;10万条脉象、舌象、经络、穴位数据;200万条真实的中医临床诊疗数据。 大经中医官网:大经中医 (dajingtcm.com) 4、本草(别名华驼,另有Med-ChatGLM) 中医大模型,免费开源,但目前无法直接使用,需下载在高性能计算机上进行复杂本地部署,也没有线上网站可体验。 哈尔滨工业大学开发的一款基于中医药知识图谱的人工智能系统,可提供中医药相关的问答、推理、分析等服务,赋能中医药行业的各个场景。 项目介绍地址(需翻墙才能访问) 本草(华驼) https://github.com/SCIR-HI/Huatuo-Llama-Med-Chinese Med-ChatGLM https://github.com/SCIR-HI/Med-ChatGLM 5、医联MedGPT 公司官网 成都医云科技有限公司 (medlinker.com) 个人无法直接使用,目前与各大医院及机构合作面向患者使用。是国内首个进行线下医院实际问诊等流程场景使用测评的大模型。已进入内部测试阶段,2023年5月正式发布。已拥有近3000种疾病的首诊能力,覆盖80%以上的成年人疾病和90%以上的0-12岁儿科疾病。突破AI医生无法与真实患者连续自由对话的难点,并在医疗问诊场景中支持多模态的输入和输出,在疾病的预防、诊断、治疗、康复四个重要环节全面实现智能化。MedGPT模型相关介绍文章如下: 文章一:医疗版ChatGPT直播评测!治疗方案与真人医生96%一致 文章二:鏖战一天,与三甲主治医师医学一致性达到96% 医联 MedGPT 通过首次公开大考! 在微信公众号“医联Medlinker”中有个“医联MedGPT 媒体沟通会”的发布会视频,里面详细讲解了模型具体情况。 6、砭石 中医大模型,不免费,可简单体验。智慧眼开发的医疗领域大模型砭石,是一款支持多模态(文本、图像、视频和音频)输入的人工智能医生,可以提供智能问诊、辅助诊断、智能用药等服务,赋能医疗健康行业的各个场景。 体验方法:扫描智慧眼官网上的二维码,体验互联网医院的服务,包括智能导诊、在线问诊、处方流转、药物配送等。扫描后进入小程序进行微信登陆,添加就诊人并实名认证,后自动跳转到“急速问诊”页面,该问诊就是基于砭石模型问答。下次再次使用时在小程序首页上的“问诊购药”或“复诊续方”功能按钮进入问答界面。("砭"读bian一声) 产品介绍官网(页面下滑找到微信小程序二维码) 智慧眼-人工智能/医疗健康-AI计算驱动生命健康 7、京东JDH 京医千询 基于京东自己的言犀大模型打造,投喂了京东互联网医院积累了上亿级的医疗问诊数据。远程医疗两个场景:一是药师的问答;二是医患问答。目前与互联网医院及医疗机构合作面向患者使用,个人目前无法直接使用。没有找到官网相关链接及信息,欢迎评论补充。感兴趣的可通过京东云网站客服等渠道咨询就行。 京医千询_百度百科 (baidu.com) 8、腾讯健康医疗大模型,面向B端医院企业商业,不对个人开放,官网:腾讯健康 9、百度灵医智惠,面向B端医院企业商业,不对个人开放,官网:灵医智惠 10、华为云盘古医疗,网址:盘古大模型_panguLM_大模型_华为云,药物分子大模型,医疗大模型。 11、清华药物研发助手ChatDD,详情介绍网址:水木分子发布ChatDD 新一代对话式药物研发助手,引领药物研发第四范式 将于2023年10月中旬邀请测试基础版本。清华系初创团队水木分子宣布发布新一代对话式药物研发助手ChatDD(Drug Design),覆盖药物立项、临床前研究、临床试验的各阶段,作为制药专家的得力AI助手,提升药物研发效率。千亿参数多模态生物医药对话大模型ChatDD-FM 100B。“制药版 ChatGPT”。兼具多模态和对话双重特点,能给医药界学生“解个惑”。主要给国内医药行业“打辅助”,侧重中文对话能力,融入了更多专家的对话模式和经验。 12、清华BioMedGPT,项目开源地址:https://github.com/taokz/BiomedGPT 生物医药版ChatGPT。清华大学聂再清教授带领团队着手构建的多模态生物医药领域基础模型,旨在将生物世界分子、文本与知识进行统一表示学习以达到在各项下游任务上能力的整体提升。通过打造的干湿闭环和专家在环的双闭环体系,使得BioMedGPT能够从真实世界学习、向人类专家学习有望成为生物医药研发基础大模型,支撑诸如高通量虚拟筛选、分子生成与优化、个性化药物重定位、生物医药知识检索等多项应用。主要用于科研领域,更擅长英文生物医药科研任务,适合直接拿来作为生物医药领域的相关科研任务的基础模型。

    发布时间: 2023-12-01

  • 16. 面向高质量本科人才培养的信息素养教育创新探索
    杨小芳
    摘要 这篇论文主要介绍了清华大学图书馆在本科人才培养中创新信息素养教育实践和思路,以支持高质量人才培养。 方法 以清华大学图书馆为例进行介绍。 优化规划设计,加强面向拔尖创新人才的课程建设。 积极拓展合作,深度支撑大学人才培养。 开展项目式创新实践探索,助推人才培养。 结论 通过介绍清华大学图书馆在本科教育中的信息素养教育创新实践和思路,探讨了如何将信息素养教育融入大学人才培养生态体系,以支持高质量人才培养。

    发布时间: 2023-12-01

  • 17. 引用功能感知的知识单元引用网络构建与多维分析
    程冰
    引用功能感知的知识单元引用网络构建与多维分析 针对知识单元引用网络中关联关系单一的局限,本文通过引用功能增强网络节点之间语义关联类型,提出一种引用功能感知的知识单元引用网络,并进行领域知识多维分析。首先对学术文本进行解析,抽取文献间引用关系、引文上下文以及引用对象等信息,并对引用功能和引用对象进行自动识别。在此基础上,采用复杂网络图方法构建引用功能感知的知识单元引用网络,从网络结构分析与可视化、知识单元多维引用关联分析、知识群落分析 3 个方面进行领域知识多维分析,并以国际计算语言学协会会议论文数据集为例进行实证研究。结果验证了本文所提出方法的有效性,发现了特定领域知识间使用、扩展和对比模式,丰富了知识群落的语义信息。本文扩展了知识单元引用网络的研究方法,深层次揭示了学科知识之间的语义关联,为学科知识结构分析提供了一种新的路径。 研究方法包括对学术文本的解析,抽取文献间引用关系、引文上下文和引用对象,并自动识别引用功能和引用对象。利用复杂网络图方法,构建了引用功能感知的知识单元引用网络,并从网络结构分析与可视化、知识单元多维引用关联分析、知识群落分析三个方面进行领域知识的多维分析。实证研究以国际计算语言学协会(ACL)会议论文数据集为例,验证了所提方法的有效性,并发现了特定领域知识间的使用、扩展和对比模式。 图表 1整体研究框架 文章还回顾了知识单元引用网络和语义功能感知的科学知识网络的相关研究,指出现有研究在语义功能增强方面的不足,并强调了从引用功能视角进行知识单元引用网络语义增强和分析的重要性。此外,文章也探讨了引文语义功能识别的相关研究,包括引用功能和引用对象的识别方法,以及这些方法在科学知识网络中的应用。 在研究方法部分,本文详细介绍了数据收集与预处理、引用功能与引用对象识别方法、以及引用功能感知的知识单元引用网络构建方法。数据收集涉及ACL会议论文集的全文文献,通过Grobid工具解析成xml格式,便于信息抽取。引用功能和引用对象的识别采用了BERT+Bi-LSTM+Attention模型和BERT+CRF模型,这些模型结合了深度学习和序列标注技术,以提高识别的准确性。 实验与结果部分展示了引用功能和引用对象识别的实验结果,以及网络结构分析与可视化的结果。实验结果显示,所设计的模型在引用功能识别任务上取得了高准确率,而在引用对象识别任务上,BERT+Bi-LSTM+CRF模型表现更佳。网络结构分析揭示了网络的稀疏性、平均度、平均加权度等特征,并通过Gephi工具进行了网络可视化。 研究成果指出本文提出的引用功能感知的知识单元引用网络能够细粒度地揭示领域知识间的关联关系,为科学知识图谱绘制和知识结构分析提供了新的视角。同时,文章也指出了研究的不足之处,如数据规模较小、对施引文献知识单元处理简单等问题,并提出了后续研究的方向。 本文通过构建和分析引用功能感知的知识单元引用网络,为理解和揭示科学知识发展变化的特征和规律提供了新的研究方法和视角。

    发布时间: 2024-11-22

  • 18. 高等院校人工智能素养教育的内容体系与发展理路
    饶海侠
    在第四次工业革命来临之际,培养具备人工智能素养的的各类人才逐渐得到重视,高校需要与时俱进,构建人工智能素养教育内容体系。2022年2月5日王奕俊、王英美、杨悠然在《黑龙江高教研究》期刊上发表《高等院校人工智能素养教育的内容体系与发展思路》一文。文章从素养连续统和人工智能技术两个层面阐释了人工智能素养,在对高等院校人工智能素养教育内容廓清的基础上提出了高等院校人工智能素养教育的发展理路。 一、研究内容 1.人工智能素养的释义 信息素养、数字素养和人工智能素养存在密切的关系,人工智能素养起源于素养连续统,是素养连续统在智能时代的拓展,更加注重强调伦理和思维的重要性。“知识”、“技能”、“意识”、“伦理”和“思维”是人工智能素养的重要组成部分。 2.高等院校人工智能素养教育的内容廓清 人工智能素养包括人工智能知识、人工智能技能、人工智能意识、人工智能伦理和人工智能思维。人工智能知识需要得到基本掌握,包括事实知识、原理知识、技能知识和知道是谁的知识;人工智能技能指的是识别、分析、应用和创造人工智能的能力;人工智能意识指的是对人工智能带来的双重影响的观点和态度,包括人工智能影响意识、需求意识和安全意识;人工智能伦理指的是要形成以人为本的价值认同,合法地、合乎道德地、安全负责地使用人工智能;人工智能思维指的是发展智能时代的一种高阶思维,核心是认知,强调计算思维和系统思维。 二、研究结论 高等院校人工智能素养教育的发展理路为以下四点。首先,研究与制定人工智能素养标准,为人才队伍的培养与建设提供依据;第二,革新人才培育理念,将人工智能素养教育与专业课程相结合;第三,完善人工智能素养课程建设;第四,提高教师人工智能素养,为人工智能素养教育提供重要保障。

    发布时间: 2024-07-26

  • 19. 【公示】2023年科技期刊世界影响力指数(WJCI)发布!
    于彰淇
    日前,中国科协课题成果《科技期刊世界影响力指数(WJCI)报告》2023版(以下简称《WJCI报告》)已预发布,报告的研制说明及评价指标详见http://wjci.cnki.net网站。 《WJCI报告》由中国科学技术信息研究所、《中国学术期刊(光盘版)》电子杂志社有限公司、清华大学图书馆、万方数据有限公司、中国高校科技期刊研究会、中国科学技术期刊编辑学会联合研制,是一份对全球科技期刊的评价报告。 该报告从全球正在出版的6万余种科技学术期刊中精选1.5万种为统计源,体现了地区代表性、学科代表性、行业代表性。在遴选统计源期刊过程中,课题组参考了期刊的总被引频次、影响因子、高被引论文数、高被引机构参与度等客观数据,并充分借鉴了国内外知名数据库和期刊评价机构成果,优化了统计源期刊的国家分布,更加客观呈现全球科技创新实景。 《WJCI报告》坚持期刊分类评价,分类体系在充分借鉴国际各数据库分类基础上,以国家标准为基础,细分学科进行期刊评价,并突出了前瞻性和实用性。为了反映学科交叉融合的发展现状,今年新增5个跨文理的学科类目,使期刊学科类别达到296个。在此分类标准下,《WJCI报告》2023版对中外期刊采用了统一的引证数据统计源、统一的评价指标计算方法的定量评价。 该报告发布的期刊评价指标——“科技期刊世界影响力指数(WJCI)”是基于影响因子、总被引频次、网络浏览和下载、新媒体关注量等数据的综合评价指标。详情请参见《研制报告》。 根据《WJCI报告》2023年版,收录中国期刊1772种,中国期刊的WJCI指数均值为1.487,居世界第八位。中国有130种期刊WJCI、总被引频次、影响因子学科排名位居全球TOP5%或学科排名TOP3。以下为130种期刊名单。

    发布时间: 2023-12-01

  • 20. 生成式人工智能专家笔谈
    于彰淇
    2023年5月,习近平总书记在主持召开中共中央政治局会议时提出,“要重视通用人工智能发展,营造创新生态,重视防范风险”,为推动生成式人工智能的发展指明了方向。为深入贯彻落实习近平总书记的重要指示精神和党中央决策部署,2023年7月,国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局公布了《生成式人工智能服务管理暂行办法》(以下简称《办法》)。《办法》明确提出了生成式人工智能服务与管理主要原则,“国家坚持发展和安全并重、促进创新和依法治理相结合的原则,采取有效措施鼓励生成式人工智能创新发展,对生成式人工智能服务实行包容审慎和分类分级监管”,并从基本概念、发展举措、服务方式、监督检查、法律责任等方面提出规范要求,为生成式人工智能的健康发展提供了重要保障,是我国在人工智能治理之路上迈出的关键一步。 本刊编辑部对《办法》的制定和出台一直保持密切关注。早在2023年4月,《生成式人工智能服务管理办法(征求意见稿)》发布不久之后,编辑部即邀请多位专家聚焦这一议题,持续跟踪《办法》与生成式人工智能的进展。与以往的笔谈相比,此次专栏的独特之处可以用八个字来概括:跳出边界、奔向未来。生成式人工智能的影响力无远弗届,已经开始深入人类社会的政治、经济、文化、伦理等方方面面,这些影响力亦在互相渗透,逐步编织起一个崭新的智能时代——《办法》第五条也提出,“鼓励生成式人工智能技术在各行业、各领域的创新应用,生成积极健康、向上向善的优质内容,探索优化应用场景,构建应用生态体系”。面对这种纵跨多行业和领域的新型技术,唯有“跳出边界”,以跨学科的宏阔视域、多领域的密切合作、全场景的实践方案,方能更好地应对其滔天翻浪式的影响和冲击;唯有以预见式的眼光、带入负责任创新的理念,汇聚多方面的思想资源和行动力量,方能奔向“积极健康、向上向善”的未来,有力地回应其带来的、复杂且复合的“技术-社会”议题!

    发布时间: 2023-12-01

  • 21. 《北京市人工智能行业大模型创新应用白皮书(2023年)》发布
    杨小芳
             11月29日,北京市科学技术委员会、中关村科技园区管理委员会在AICC 2023人工智能计算大会上发布了《北京市人工智能行业大模型创新应用白皮书(2023年)》(以下简称《白皮书》)。    《白皮书》从大模型全球发展态势、国内外行业应用概述、北京应用情况和发展建议等方面进行了系统分析和阐述,旨在进一步推动大模型应用落地,展示北京市大模型应用成果,促进大模型价值传播和供需对接。    《白皮书》认为,大模型技术迅速迭代,打破了原有AI技术发展的上限,呈现出数据巨量化、模型通用化、应用模式中心化等特点,以“无限生产”的能力重塑企业生产引擎,推动生产效率颠覆式提升。从全球范围看,世界各地均在积极推动大模型研发和应用,其中美国和中国发布的通用大模型总数占全球发布量的80%,成为大模型技术领域的引领者;欧盟、英国、加拿大、新加坡等国家和地区尚处于前期尝试阶段,仅个别头部企业开始应用。从全国范围看,国家和地方层面高度重视通用大模型产业发展。2023年7月,国家网信办、国家发展和改革委员会、教育部、科学技术部、工业和信息化部、公安部、国家广播电视总局等7部委联合公布《生成式人工智能服务管理暂行办法》,鼓励和规范生成式人工智能创新发展;北京、上海、广东等多省市也陆续出台大模型产业发展措施,加速大模型应用落地。从北京市大模型产业发展来看,北京是当前国内人工智能领域创新基础最好、人才资源最集中、研发创新能力最强、产品迭代最活跃的地区,现已拥有大模型创新团队122家,数量居全国首位,约占全国的一半。    《白皮书》详细梳理了现阶段北京市大模型应用的典型特点。从模型演进看,通用大模型趋于收敛,垂直行业应用成为大模型产业落地的关键赛道;当前,大模型发展呈现出从技术到产品、再到商业化应用的发展路径,并不断深入垂直行业领域。从应用领域来看,大模型应用案例百花齐放,已经在传统产业赋能、金融、政务、文化旅游、医疗、智慧城市等各个领域得到初步应用,其中,传统产业赋能和金融领域发展较快,如传统产业赋能领域有产业知识问答、图文生成等,金融领域有智能投研助理、智能客服等。从应用类型来看,大模型主要有内容生成、智能问答、IT支持、数据分析、智能识别和智能硬件等六个方面,其中内容生成和智能问答最为成熟。从商业模式来看,目前大模型商业模式初具雏形,形成了以通用大模型AI服务为主的基础层、以垂直行业领域AI服务为主的行业层和以大模型应用服务为主的应用层,三层服务相互促进,协同优化,共同支撑产业转化和发展。    《白皮书》对北京市大模型应用案例进行了梳理,从政务、金融、医疗、传统产业赋能、文化旅游、智慧城市等六个行业领域切入,围绕创新性、示范性、经济与社会效益性、可推广性等四个维度,选取衔远科技、360、瑞莱智慧、旷视、百度等18个典型案例,详细分析了各领域用户需求、解决方案、项目成果。如衔远科技围绕北京一轻科技集团在市场需求跟踪、新型产品研发等方面需求,打造品商大模型示范应用,形成商品智能反向定制、预测性生产、智能调度、智能营销等服务功能,加速消费制造领域全链路数智化升级;360围绕银行在数字化转型方面需求,打造金融领域大模型,实现员工平均办公文档处理时间减少40%等。基于案例分析,《白皮书》进一步提出了目前大模型应用落地面临的挑战。一是算力资源供不应求,成为大模型企业创新研发的重要挑战。二是高质量数据成为严重掣肘大模型行业应用的关键。三是大模型幻觉问题有所改善,但离规模落地尚有差距。四是大模型应用存在“蹭热度”和同质化情况。 附件:北京市人工智能行业大模型创新应用白皮书(2023年)

    发布时间: 2023-12-01

  • 22. OpenAI与美国国家实验室合作,扩大GPT-4o应用范围
    程冰
    7月11日,OpenAI在官网宣布与美国顶尖的国家实验室之一洛斯阿拉莫斯进行技术合作,研究如何安全地在实验室环境中使用GPT-4o等多模态模型,加速生物科学研究。 最近,美国白宫发布了一项关于安全、可靠、值得信赖的AI发展和使用的行政命令,要求美国能源部的国家实验室帮助评估前沿AI模型的能力,包括生物学能力。 这对OpenAI来说很重要,因为它们相信AI有潜力加速科学的发展,为人类带来好处。例如,Moderna公司正在利用OpenAI的技术来辅助临床试验开发,构建了一个数据分析助手,帮助分析大量数据。 ColorHealth通过GPT-4o建立了一个新的辅助工具,帮助医疗提供者做出基于证据的癌症筛查和治疗决策。 OpenAI和洛斯阿拉莫斯国家实验室的生物科学部门正在进行一项评估研究,像GPT-4o这样的多模态模型,如何通过视觉和声音等能力帮助人类在物理实验室环境中执行各种任务。 例如,对湿法实验室设置不太熟悉的研究人员可以简单地向GPT-4o展示他们的设置,并提出问题,并通过相机直观地排除故障以简化整个实验流程;或者将外来遗传物质引入宿主生物体,细胞培养等。

    发布时间: 2024-07-26

  • 23. 2025年人工智能十大趋势
    程冰
    美国《福布斯》杂志于9月24日刊登题为《人人都必须为2025年的十大人工智能趋势做好准备》的文章,作者为未来学家伯纳德·马尔。文章深入剖析了2025年人工智能(AI)的十大趋势,这些趋势不仅预示着技术的不断进步,也反映了人类社会在面对科技变革时的适应与挑战。 今年,几乎所有主要的软件工具都在匆忙整合生成式人工智能功能。谁都不愿意错过这次上船的机会。2025年,我预计,人类将更多地考虑如何与人工智能携手合作,扩展我们的技术能力,同时腾出时间把我们的创造性和人际交往技能应用到机,器仍然无法管理的工作中这不是简单地把聊天机器人添加到所有领域,而是未来一年智能企业开始利用人工智能创造真正价值的方式。 趋势二:实时自动决策 随着企业开始从战略上应对利用人工智能的挑战,那些拥有更加成熟的人工智能战略的企业将走向整个业务流程的端对端自动化。这很可能发生在物流、客户支持和营销领域,算法将在这些领域进行决策,比如如何管理库存和如何以最小的人为干预回应客户问询。这将带来更高的效率和对变化中的客户习惯与市场状况更快的反应速度。 趋势三:“负责任”的人工智能 在2025年,人们将日益意识到以一种合平伦理、安全、透明、可靠和尊重知识产权的方式开发和部署人工智能的重要性。虽然这其中有部分将由立法推动,但人们也越来越意识到不负责任地使用人工智能可能造成的危害。许多人现在意识到人工智能偏见和幻觉的危险,并明白要将这种危险降到最低需要人类协同一致的努力。选择无视这一点或走捷径的企业在2025年可能会被曝光、遭遇监管机构的压力和顾客的抛弃。 趋势四:文生视频与新一代语音助手 想象一下:你可以仅仅写出一部电影的主要情节,或是一段视频的一个小片段,然后,整个视频就会在你眼前真实播放出来。想想ChatGPT(聊天生成预训练转换器),只不过生成的是活动的图像。OpenAI公司今年利用其Sora(“天空”)模型展示了这一概念,2025年它可能会开始投入使用。虽然我不认为人们马上能根据提示创作出让迪士尼公司失去收入的电影,但这是令人着迷的一瞥,可以让人看到,在不久的将来人工智能将走向何方,以及它可能具备的能力。 趋势五:人工智能立法和监管更加完善 人工智能语音助手(想想Siri或Alexa)多年来已经成为我们生活中的一部分,但传统上他们的对话能力非常有限。今年,OpenAl为ChatGPT展示了一种新的“可中断"的先进语音模式,能够进行与人类对话高度类似的对话。而谷歌已经开始将Gemini (“双子座”"人工智能模型)聊天机器人整合到移动设备中,取代现在已经过时的"Hey Google"功能。我认为,2025年,我们将看到这些能力出现在越来越多的设备中,使之能够进行更自然、更有意义的语音沟通。 趋势六:人工智能体或将流行 可以公正地认为,迄今为止,各国政府和立法人员一直在努力应对监管人工智能的挑战。今年,欧盟和中国通过了旨在限制人工智能造成伤害可能性的法律。措施包括将“深度伪造”定为犯罪,对金融、执法等领域应用人工智能进行规范等。2025年,我们可以预期更多规定出台,重点是优先考虑人权,将发生歧视和虚假信息的可能性降至最低。 趋势七:“后真相”世界 我们今天看到的大多数人工智能工县都是以执行简单任务为基础,比生成文本或解读数据以作出预测,人工智能体是能够在没有得到精确指令的情况下运作的工县,它们会把无数任务串在一起,并根据所取得的结果调整自己的行为。这可以被视为实现“通用"人工智能的重要一步,它能够完成许多不同类型的任务。然而,这也让人们更加质疑人工智能监管和问责的必要性。 趋势八:人工智能+网络安全 2025年,整个社会将面临人工智能带来的假内容和假消息爆发式增长的重大挑战。今年在全球范围内已发生干预选举的尝试。有人说,这意味着我们已经到了一个“后真相"时代,我们不再能够相信自己的眼睛看到的一切。2025年,我预计社会将开始应对这一挑战。这一改变将由各国政府通过立法推动,同时也将在民间通过教育和让人们学会更小心地辨别呈现给他们的信息来推动。在2025年,网络攻击将继续变得越来越频繁和复杂。这意味着,人工智能系统在网络安全威胁造成严重破坏之前发现潜在漏洞、异常情况,以及让网络安全系统自动化等方面将变得更加重要。不过,这并不全是关于看不见的、位于幕后的算法。随着越来越多的威胁以网络钓鱼和社会工程攻击的形式出现,聊天机器人能通过模拟网络钓鱼教会我们如何发现威胁和避免成为受害者。 趋势九:量子人工智能 量子计算虽然仍处于起步阶段,但它可能给人工智能带来革命性变化。量子计算利用亚原子水平上的材料表现出的奇特性,以前所未有的速度执行某些计算任务。让算法能够以亿倍于标准计算机的速度运行,不仅仅会让人工智能变得更快,它还可能完成全新的任务,在从疫苗和医药研发到新材料和新能源的生产等领域开辟新的可能性。预计在2025年,这种令人惊叹的潜力给人们带来的兴奋将开始增长。 趋势十:“可持续”的人工智能 可持续人工智能包含两个因素。首先,人们越来越清楚地认识到,基于云的人工智能系统需要耗费巨大能源,我认为,我们将在数据中心看到大家齐心协力地转向可持续和可再生能源。其次,旨在提高可持续性、减少其他行业的环境足迹的人工智能应用潜力巨大。利用算法尽量减少农业用水和杀虫剂的使用,到在城市更有效地引导交通出行,以减少汽车排放造成的污染,2025年人工智能将继续让自己成为环境保护的有力工具。

    发布时间: 2024-10-31

  • 24. 佳文速递|ChatGPT中文性能测评与风险应对
    黄雨馨
    ChatGPT中文性能测评与风险应对 【目的】 介绍ChatGPT的主要技术创新,使用9个数据集在4个任务上测评ChatGPT的中文性能,分析ChatGPT潜在的风险以及中国应对策略建议。【方法】 使用ChnSentiCorp数据集测试ChatGPT和WeLM模型,EPRSTMT数据集测试ChatGPT和ERNIE 3.0 Titan,发现ChatGPT在情感分析任务上与国产大模型差距不大;使用LCSTS和TTNews数据集测试ChatGPT和WeLM模型,ChatGPT均优于WeLM;使用CMRC2018和DRCD数据集进行抽取式的机器阅读理解,C3数据集进行常识性的机器阅读理解,发现ERNIE 3.0 Titan在该任务中优于ChatGPT;使用WebQA和CKBQA数据集进行中文闭卷问答测试,发现ChatGPT容易产生事实性错误,与国产模型差距较大。【结果】 ChatGPT在自然语言处理的经典任务上表现较好,在情感分析上具有85%以上的准确率,在闭卷问答上出现事实性错误的概率较高。【局限】 将判别式的任务转为生成式的过程中可能引入评估分数的误差。本文仅在零样本情况下评估ChatGPT,并不清楚其在其他情况下的表现。由于后续版本的迭代更新,ChatGPT评测结果具有一定的时效性。【结论】 ChatGPT很强大但仍然存在一些缺点,研发中国化的大模型应以国家战略需求为导向,并且注意语言模型的风险和局限。

    发布时间: 2023-10-10

  • 25. AIGC在学术写作中的应用
    杨小芳
    人工智能生成内容(Artificial intelligence-generated content, AIGC)和 AIGC 模型已成为内容创作领域的强大工具。这些人工智能系统旨在以超乎想象的速度和规模生成文本,包括学术论文。虽然人工智能技术显示出了巨大的潜力,但它也引发了一系列问题,尤其是在学术写作方面。 在本文中,我们将定义 AIGC 及其模型,探讨其在学术界日益广泛的应用,及其引发的问题,并讨论期刊如何检测未披露的AIGC。此外,还会讨论未披露 AIGC 使用情况的后果,并强调学术出版中使用人工智能的透明度和道德的重要性。 1 AIGC的定义及其模型 AIGC 是指人工智能系统制作的书面、视觉或听觉材料,通常由先进的语言生成模型驱动。这些模型进过了大量数据集的训练,能够模仿人类语言,生成各种主题的内容。近年来,人工智能生成的内容已进入新闻、营销和学术等各个领域。 在学术领域,AIGC 模型被用来起草研究论文、摘要和期刊文章,这些人工智能系统能够生成近似人类写作的文本。 2 AIGC在学术写作中的常见问题 在学术写作中越来越多地使用人工智能引起了一些关注。这些问题包括: a. 作者身份和所有权:当人工智能系统生成内容时,就会产生作者归属的问题。是程序员、用户还是人工智能本身?内容归谁所有? b. 创造性:人工智能生成的内容往往缺乏人类作者为其作品带来的创造性火花和独特视角。这可能会导致学术写作中个人风格和研究视角的缺失。 c. 虚假参考文献和偏见:人工智能生成的论文可能会引用不存在的资料来源或提供有偏见的信息。这对研究的完整性构成重大风险。 3 期刊对使用AIGC的规定 大多数学术期刊对人工智能生成器的使用都有严格的规定。虽然这些期刊通常禁止将人工智能生成器列为作者,但它们要求全面披露其使用情况。例如,有些期刊要求使用人工智能技术的作者全面介绍所使用的工具、方法以及评估所生成数据可信度的手段。透明地使用人工智能被认为是保持研究完整性的关键。 如果作者没有在稿件中声明使用了人工智能生成工具,期刊会设立机制来识别未披露的AI工具。 4 期刊采用哪些方法检测AIGC? 1. 同行评审:审稿人可以利用他们的专业知识发现稿件中不寻常或可疑的写作风格。人工智能生成的内容可能表现出句子重复和结构不连贯等模式。查重检测软件也可用于分析文本与已知 AIGC 的宏观相似性。 2. AI文本识别工具(AI Text Classifiers):机器学习算法和自然语言处理技术用于分析大量研究文章,包括已知的 AIGC 生成的内容。这些算法经过训练,可以识别人工智能生成的文章所特有的独特模式,从而区分人类和人工智能撰写的内容。 3. 元数据分析(Metadata Analysis):对文章的作者、发表日期和发表期刊等进行检查。将这些信息与 AIGC 生成的内容进行比较,可以发现相似之处。 4. 查重检查:查重工具将稿件文本与现有文章进行比较。与已知 AIGC 的高度相似性可能表明使用了AI生成器。 5. 无监督机器学习:聚类算法把与 AIGC 生成内容相似的研究文章进行分组,帮助检测。 6. 人工审核:使用 AI生成工具可能性较高的文章可能会经过人工审核,确保AI检测工具的准确性。 5 未披露AIGC使用情况的后果 如果学术期刊发现稿件中使用了AIGC,但是论文中没有说明,可能会给作者带来不利后果。这种行为被认为是不道德的,会对作者的诚信造成不良影响。 1. 伦理影响:学术写作中未披露 AIGC 会引发严重的伦理问题。它破坏了诚实、透明和学术诚信的原则。 2. 损害作者声誉:这可能会造成长期的后果,因为诚信和信誉在学术界至关重要,学者和同事可能会对这类作者产生怀疑,他们今后的贡献也可能会受到质疑。 3. 期刊拒稿:如果在编辑审核或同行评审过程中发现未披露AIGC,期刊可能会直接拒稿。 4. 对期刊公信力的影响:读者和整个学术界都依赖期刊坚持严格的标准,这方面的任何疏忽都会对期刊的声誉造成不利影响。 5. 法律影响:在极端情况下,未披露AIGC 使用情况可能会导致法律后果。抄袭和学术不端行为会受到严肃处理,受此类行为影响的机构或个人可能会追究法律责任。

    发布时间: 2024-01-19

  • 26. “京城飘书香 五洲共阅读” 第21届北京国际图书节开幕
    程冰
    6月15日,第21届北京国际图书节开幕式在国家会议中心举行。本届活动以“京城飘书香 五洲共阅读”为主题,将持续至18日,设置展示区、展销区和活动区3个功能分区、10个主题分区。 开幕式上,“走出去”项目《潮北京》多语种版出版,由北京广播电视台、北京出版集团、外文出版社现场举行签约仪式。故宫博物院原院长郑欣淼和英国知名汉学家、历史学家吴芳思进行了好书推荐。 记者在图书节现场看到,中华优秀传统文化展区精心策划了“玉楮流芳——中国古代书籍装潢艺术展”“光影中的古都之美——北京老照片展”“北京历史文献展”“中华优秀传统文化出版物展”以及“国家级非物质文化遗产古籍修复技艺展示及体验”5大专展。展区内,高3.7米、长15米高清显示屏循环播放栩栩如生的《万寿盛典图》及图解、《北京中轴线》影像,向广大读者呈现了一场集视觉、听觉和感观为一体的优秀传统文化盛宴。 “玉楮流芳——中国古代书籍装潢艺术展”上,中国书店充分发挥古旧书特色优势,细致甄选出近20种不同年代、装帧形制的古籍文献,隋写本《大般涅槃经》、北宋开宝八年吴越王钱俶刻本《一切如来心秘密全身舍利宝箧印陀罗尼经》、南宋刻本《欧阳文忠公集》、元福州路刻本《礼书》等格外引人注目。中国书店古籍修复技艺第四代传承人徐晓静现场展示修复技艺,她用一把镊子修复虫蛀的明代古籍,引来观众连连称赞。据介绍,观众既可以“零距离”观摩,也可在传承人的指导下“亲手做”,沉浸式体验古籍修复技艺。 值得一提的是,本届图书节的主会场开辟50%的区域作为出版物展销区,汇集400余家中外出版机构,集中展示展销10万余种优质出版物。读者不仅可以参与好玩有趣涨知识的活动,更能享受部分书籍打折优惠。图书节上的哈利·波特快闪店一露面,就吸引了众多哈迷前来打卡。中国图书进出口总公司工作人员赵圆告诉记者,快闪书店销售100多种哈利·波特周边图书,连哈利·波特小时候读的童话书都在其中。 接下来,观众熟悉的名家大讲堂也依然会延续,本届北京国际图书节特别邀请王蒙、李忠杰等名家,围绕文化自信自强,为读者带来10场高品质、宽视野的文化盛宴。观众除参与线下分享外,还有机会在现场获取名家签名,无法到达现场的观众,也可以通过新媒体平台同步收看线上直播。 据介绍,“书店之夜”活动作为图书节分会场,于6月16日到18日(每天16:30至20:30),在前门书香世业、PAGEONE书店(北京坊店)开展。活动汇集88家实体书店,全市将举办140余场活动(现场将举办60场活动),推荐上千种优质图书。活动现场还将宣布“最美书店、最佳店长(主理人)”评选结果及颁奖;召开“北京市实体书店高质量发展对话”,就北京市实体书店的创新发展之路交流互鉴。

    发布时间: 2023-07-11

  • 27. 数字化转型视域下的数据价值研究综述:内涵阐述、作用机制、场景应用与数据创新
    黄雨馨
    数字化转型视域下的数据价值研究综述:内涵阐述、作用机制、场景应用与数据创新 马捷 / 郝志远 / 李丽华 / 张羽 图书情报工作.2023 Vol.67 (15): 4-13. 摘要: [目的/意义] “数据价值”作为数字化转型视域下一种不断深化的概念,当前与之直接相关的研究尚处探索阶段。对既有研究进行解构梳理、认知辨识,有利于开掘激发数据潜力、释放数据活力的全新数字化范式。[方法/过程] 在数字化转型背景下探索数据价值的概念内涵,并结合数字化转型的现实特征以及既有研究所呈现出的热点态势,明晰数据价值的作用机制,厘清数据价值在不同外化场景中的应用表现,同时洞悉数据价值驱动下的数据创新行为,最终剖析出当前数据价值研究存在的局限与桎梏。[结果/结论] 当前关于数字化转型视域下的数据价值研究总体呈现出分散化、模块化的态势特征,相关研究的聚焦性不强、侧重性不明显。未来还需要在数据成为生产要素的价值特征、数据价值“形成、释放、实现”的理论逻辑以及科学设计数据价值驱动的数据创新路径与实现模式等方面深入探索。

    发布时间: 2023-10-10

  • 28. 字节推出首个复杂材料的大规模量子模拟算法,成果入选 npj Computational Materials
    黄雨馨
    量子计算作为新的计算范式,已经展现了在量子化学领域中的潜在巨大价值,为药物发现、材料设计和催化剂优化等领域提供了广阔的前景。 目前在简单分子的量子模拟方面已经取得了令人振奋的进展,但在量子计算机上进行固体材料的模拟仍然困难重重。这是因为不同于孤立的分子,要想准确计算材料的性质,需要将系统的规模推广至热力学极限。这会使得问题规模随采样 K 点迅速增大,模拟所需的量子资源爆炸式增长。 譬如,针对一个典型的复杂体系过渡金属氧化物-氧化镍(NiO),尽管该体系在材料模拟计算中属于中小规模的问题,仍然需要大约 10000 量子比特,这将远超当前量子计算机可以处理的范畴。根据目前业界最新的报道,目前在真实量子计算机上的化学模拟最大规模却不超过 20 量子比特。 针对当前含噪中等规模量子器件,由于系统的有限相干时间、量子门的保真度等一系列因素,极大限制了当前量子计算机能实际处理问题的规模。为应对这一挑战,字节跳动 ByteDance Research 团队创造性地结合了量子嵌入理论和量子计算,极大地扩大了当前量子处理的问题规模。团队首先在分子体系上,进行了系统性测试,值得一提的是,团队用 16 量子比特模拟了 144  比特系统 C18 分子(ccpvdz 基组),并准确预测了相关体系的稳定结构,符合实验预期,相关结果已经发布在国际顶级期刊《Chemical Science》[1]。 从分子过渡到材料,并进一步围绕材料体系中存在的强关联系统进行的深入研究是一个自然的延伸,也是目前凝聚态领域等研究的热点和难点。同时,研究相关典型的强关联系统,有望进一步帮助我们理解更复杂的体系,如催化机理,超导机理等相关课题的研究,构建理解微观机制到宏观奇特量子现象的桥梁。因此当前或者中长期的量子器件上实现对固体材料的量子模拟,是一个十分必要的课题。 近期,字节跳动 ByteDance Research 团队联合清华大学胡憾石课题组,北京大学袁骁课题组和牛津大学孙金钊博士在最新工作《Ab initio quantum simulation of strongly correlated materials with quantum embedding》[2]中为这一问题提供了一种潜在的解决方案。 在这一工作中,受到上述《Chemical Science》工作的启发,以及 Garnet Chan 组近期发表在《Science》上的工作,提出的多层划分方法[3],作者在周期性密度矩阵嵌入理论中,引入了一种更精细的基于轨道的多片段划分方法,有效地缩减了当前的问题规模,以适应近期量子计算机的能力范围。通过在具有复杂电子结构的固态系统上进行实验,该方法展示了比传统方法更出色的准确性和效率。其中,作者重点研究了 1 维氢链的自旋极化态(1D-H)、2 维硼氮化物层的状态方程(h-BN)以及 3 维典型强关联过渡金属镍氧化物(NiO)中的磁序。相关研究成果于 2023 年发表于国际知名期刊《npj Computational Materials》。 论文链接:https://www.nature.com/articles/s41524-023-01045-0数值实验结果针对材料体系的研究,尽管整个问题的规模非常大,但其中最复杂或者我们最感兴趣的往往仅仅是系统的小部分,系统的剩余部分可以用便宜的方法进行准确的模拟,只有一部分需要用昂贵且精确的方法来处理,这就是量子嵌入理论的精髓。通过对系统进行多尺度求解,我们可以在求解规模和精度上达到一个平衡。具体而言,作者采用了多尺度的量子-经典混合算法,抽取出体系中作者关心的部分,利用量子计算机来处理,而剩下的部分,仍然交由经典计算机进行求解。其大体的流程如下图所示: 图 1:基于周期性密度矩阵嵌入理论的量子-经典混合算法流程图。作者通过对三个不同系统的模拟:1 维的氢链(1D-H)、2 维的六角硼氮层(h-BN)和 3 维的强相关过渡金属氧化物氧化镍(NiO),并与实验或其他精确的量子化学方法做了比较,以验证算法的可靠性和准确性。 在 1 维的氢链研究中,作者采用整个原胞当作片段(即图 1 中的 a 或 b),重点展示了非限制的幺正耦合簇拟设态 (Unrestricted Unitary Coupled-Cluster Ansatz) 的能力。在 2 维的六角硼氮层 (h-BN) 研究中,作者将单个原胞进行多片段划分,并得到和理论符合预期的结果,验证了在轨道尺度进行多片段划分的有效性。在 3 维的强相关过渡金属氧化物氧化镍 (NiO) 中,作者采用了在轨道尺度进行多片段划分方法和非限制的幺正耦合簇拟设态来系统地研究 NiO 的磁序,并得到合理的能量间隙。其中,为了模拟 NiO 的 AFII 和 FM 态,作者采用了每个单胞包含 2 个化学式单位的斜方晶体结构。Ni 原子简并的 3d 轨道会在 NiO 固体中的正六面体晶体场的作用下劈裂为半充满的和全充满的  两组轨道,进而作者将 NiO 单胞划分为三个片段,前两个片段分别包含一个Ni原子的 轨道和邻接 O 原子的 2p 轨道,并用量子计算机来处理这两部分;剩下的所有轨道都放入第三个片段,用经典计算机来处理。图 2:(a)NiO 的晶体结构。(b)计算中用到的 NiO 斜方晶体结构,以及片段划分示意图。此外,为了评估算法在真实量子硬件上的效果,作者还评估了噪音对计算结果的影响。总之,数值模拟结果表明,基于周期性密度矩阵嵌入理论的量子-经典混合算法,不仅可以计算准确可靠的材料性质,还能有效地减少量子资源的需求,尤其是对于氧化镍材料 (NiO),混合算法使量子资源需求从多达 9984 量子比特降至仅为 20 个,使得有可能在近期量子硬件上进行实验模拟。具体量子比特数,如下: 表1:文中所研究的每个系统的量子模拟所需要比特数。这些结果表明,现在可以使用量子计算机结合量子嵌入理论,对实际的固体材料相关性质进行定量预测。这项工作也为近期量子设备上的大规模和复杂周期系统的从头模拟研究铺平了道路。参考文献:[1] Li, W. et al. Toward practical quantum embedding simulation of realistic chemical systems on near-term quantum computers. Chem. Sci. 13, 8953–8962 (2022).[2] Cao, C. et al. Ab initio quantum simulation of strongly correlated materials with quantum embedding. npj Comput Mater 9, 1–11 (2023).[3] Cui, Z.-H., Zhai, H., Zhang, X. & Chan, G. K.-L. Systematic electronic structure in the cuprate parent state from quantum many-body simulations. Science 377, 1192–1198 (2022).

    发布时间: 2023-07-11

  • 29. 数字生态下数据向善的源起、要素、驱动与困境
    黄雨馨
    数字生态下数据向善的源起、要素、驱动与困境 储节旺 / 李佳轩 图书情报工作.2023 Vol.67 (10): 3-14. 摘要: [目的/意义] 探析数据向善的本质内涵与边界,对其实现的驱动因素进行挖掘,以帮助我国数字生态实现常态化数据向善发展。[方法/过程] 通过理论溯源探求数据向善的内在要素与范畴,界定其本质概念,之后使用ISM模型分析数据主体采取数据向善行为的驱动因素,最后剖析数据向善实现的困境与未来。[结果/结论] 研究发现驱动数据主体采取数据向善的动因可以分为核心动因、间接动因与表层动因,选择合适的驱动因素是实现数据向善的关键。在未来如果想要在社会层面上普及数据向善,需要从行规、法律、市场环境等多个维度出发。

    发布时间: 2023-10-10

  • 30. 高等教育研究中的数字能力:系统文献综述
    饶海侠
    在信息知识社会,科技快速发展并深入渗透到我们的生活中,关于数字能力的讨论已成为当今的热门话题。冠状病毒(Covid-19)出现及其对教育行业产生巨大影响后,学者对数字能力的关注达到了新的高度。 2021年4月8日,学者Y. Zhao等人在《Computers & Education》期刊上发表《Digital competence in higher education research: A systematic literature review》一文。该文献综述使用 Web of science 和 Scopus 作为数据库来存储和分析高等教育环境中数字能力的现有研究。该综述的目的是为学术界提供2015年至2021年高等教育背景下数字能力研究的最新概况,包括数字能力的定义、评估数字能力的维度、研究目的、方法和结果和限制。主要调查结果包括,大多数出版物在描述数字能力的定义时引用了研究和欧盟政策。审查表明,大多数大学生和教师具有基本的数字能力水平。 此外,鼓励高等教育机构注重学生和教师数字能力的发展,制定相关学习策略并使用适当的工具来提高教育质量。 研究内容 本篇文章是一篇关于高等教育中数字能力的系统文献综述。研究通过对33篇相关研究的分析,回答了四个研究问题:1)高等教育中数字能力的定义是什么?2)常用的评估高校教师和学生数字能力的维度有哪些?3)过去七年来,在高等教育领域中关于数字能力的研究目的、方法和结果有哪些?4)高等教育中数字能力研究存在哪些限制??为了回答这些问题,研究采用了系统综述的方法,选择了Web of Science和Scopus两个电子数据库进行文献检索。通过应用特定的搜索字符串,筛选出符合研究目的和标准的文章。研究结果显示,数字能力的定义涵盖了信息、沟通、数字内容创作、安全和问题解决等多个维度。在评估高校教师和学生的数字能力时,常用的维度包括ICT工具的使用和知识、互联网和ICT相关能力、数字相关经验和对数字技术的态度等。过去七年来的研究主要集中在调查和评估参与者对数字能力的认知和水平、探究影响数字能力的因素、评估数字能力对学生成就的影响以及研究数字能力相关工具的验证等方面。文章最后指出了研究的限制,并提出了未来在高等教育中数字能力发展方面的研究建议。 研究结论 1. 高等教育中数字能力的研究主要关注教师和学生的数字能力水平和认知。研究多角度评估了学生的数字能力认知,包括一般认知水平和特定类型的认知。同时,研究还探讨了影响数字能力的因素,以及数字能力对学生学业成就的影响。 2. 在研究方法方面,研究采用了多种研究方法,其中最常见的是定量研究方法,通过问卷调查收集数据。部分研究还应用了偏最小二乘结构方程模型(PLS-SEM)来探究数字能力对数字非正式学习的影响。 未来方向: 首先,大多数入选文章探讨了数字能力的认知和水平。然而,他们中的大多数人通过自我报告的数据来评估它,这些数据可能无法显示他们的数字能力的真实水平。对数字任务进行实际测试可以更好地了解参与者的数字能力。此外,亚数字能力领域不容忽视,值得更详细地研究。 其次,本系统综述的结果表明,在总共33项研究中,涉及数字能力的教学法和数字能力相关工具的验证仅占6%。需要进一步探讨如何利用和沉浸数字能力进行教学,以及如何建立和验证与数字能力相关的工具。 第三,根据本次系统文献综述的结果,许多文章只使用了一种研究方法。定量数据方法与定性数据方法相结合,可以提供有关高等教育数字能力的更全面的结果。 最后,本系统综述的结果表明,本科生是数字能力研究中研究的常见群体,尤其是一年级学生。尽管本科生在高等教育学生中所占比例最大,但对研究生和教师进行更深入的与数字能力相关的研究是相关的。未来的研究人员应该注意样本量,因为这些可能会影响结果是否具有代表性。

    发布时间: 2024-10-31

  • 31. 国际图联发布Trend Report 2024: Survey Results
    杨小芳
    国际图联在2024年8月启动了一项调查,以收集对各种发展趋势的影响及其之间联系的观点。调查结果于当地时间2024年9月4日公布。 《国际图联趋势报告》的核心任务是支持图书馆、信息工作者及相关协会以知情、有准备、有自信的姿态来迎接未来。报告的重点是评估知识和信息环境的演变,展望未来可能出现的情况,并探索图书馆如何在实践中为变革贡献力量。报告并非要定义一个具体的愿景,而是设想可能出现的不同前景,以及如何适应它们。因此,2024年的《国际图联趋势报告》将围绕一系列设想情景展开,探讨这些趋势可能产生的积极或消极影响,特别是它们可能产生的相互作用。 调查结果分析表明,随着技能需求的日益增长以及人们对数字平等问题的日益关注,对图书馆的需求也将随之增长。尽管少有观点认为环境趋势会对图书馆或社会产生积极影响,但受访者确实认为这些趋势增加了对图书馆服务的需求。 本报告分享了国际图联对《2024 年趋势报告》文献综述中确定的趋势的调查结果。它重点介绍了不同趋势对社会、图书馆和图书馆服务需求的影响,包括全球和地区、经验水平和图书馆类型。它还强调了图书馆领域认为趋势之间最紧密的联系,特别是不断变化的知识实践与技术趋势、信任的重新谈判和数字公平之间的联系。 在《趋势报告文献综述》发布后,国际图联通过其邮件列表和社交媒体进行了一项调查。这既旨在根据对与知识和信息相关的其他出版物的广泛审查,对所呈现的趋势进行反思,又确定我们社区认为最有可能的趋势交叉点。 通过这种方式,该调查将有助于实现报告的下一阶段——一系列情景,建立知识和信息的潜在未来,作为思考我们如何为未来做好准备的基础。 概括而言,趋势是: 趋势 1:知识实践正在发生变化,未来知识体系的公平性既有机遇也有挑战。 趋势 2:AI 和其他技术正在改变社会,以及我们创建、共享和使用信息的方式。 趋势 3:信任正在被重新协商,尤其是在政府和媒体中。 趋势 4:技能和能力变得越来越复杂,但也是必不可少的。 趋势 5:数字技术及其优势分布不均。 趋势 6:信息系统使用更多资源,影响地球。 趋势 7:人们正在寻求社区联系 – 分享空间是关键。 该调查于 2024 年 8 月 9 日至 29 日开放,包含两个关键部分。第一个侧重于收集有关 7 个趋势中每个趋势的积极或消极程度的观点: 这里的想法是了解受访者对趋势的乐观程度,每个趋势都有潜在的积极和消极方面。他们还旨在激发思考宏观情况(对于一般社会或图书馆)与受访者自己的图书馆更直接的情况之间的差异。通过询问对图书馆的需求,它旨在了解受访者如何预期对图书馆服务的需求不断发展。 第二部分着眼于参与者认为重要的每个趋势,该趋势与其他趋势的关系有多强。 这将有助于我们确定定义场景的有趣领域。 此外,我们还收集了有关受访者类型(个人、协会/机构或 IFLA 单位)、他们所在的地区、他们在图书馆领域的多年经验以及他们工作的图书馆类型的数据。这使我们能够探索这些组之间的优先级是否不同。

    发布时间: 2024-10-31

  • 32. SPARC 欧洲开放教育战略 2024-2026
    徐宏帅
    SPARC 欧洲开放教育战略 2024-2026 2024年1月24日,欧洲学术出版与学术资源联盟(SPARC Europe)和欧洲开放教育图书馆员网络(European Network of Open Education Librarians)联合发表文章——《开放教育战略:2024-2026》。该战略旨在通过有针对性和以行动为导向的方法实施教科文组织开放教育资源建议书。 愿景 在推动开放获取和开放科学议程方面,欧洲高等教育中的图书馆是实现开放教育的关键、积极和值得信赖的合作伙伴。它们通过使教育资源、服务和实践可访问、开放和可重复使用,帮助实现开放教育的标准化。 “我们的使命是支持欧洲高等教育政策制定者、图书馆员、开放教育大使和促进者,通过有针对性和以行动为导向的方法,帮助实施教科文组织开放教育资源建议书。我们努力促进开放获取和开放科学发展,最大限度地为所有人提供开放教育资源、实践、服务和基础设施的获取、创建、重用和改编。同时,我们尊重并支持多样,公平和包容(Diversity, Equity and Inclusion 缩写DEI),以反映和满足当地的需求。” 关键目标 支持开放教育政策的发展,鼓励欧洲学术界对开放教育投资促进其可持续发展 倡导开放议程,明确将开放科学政策与高等院校开放教育联系起来; 向机构政策者宣传开放教育的价值; 为欧洲各地的开放教育相关政策制定提供指导; 倡导投资于开放教育人员、服务和基础设施发展以及其他。 提高对开放教育, 开放教育资源和实践价值的认识,并鼓励采取行动,比如将开放教材作为教学工具等 提高教育工作者、图书馆员和学生对开放教育、开放教育资源和开放教育实践好处的认识; 激励和促进各机构在地方、地区和国际上展示其实践案例,鼓励他们与各利益相关方进行互动; 更好地了解开放教育教科书,并将其推广为开放教育和实践的有效工具,使其与商业教科书相媲美。 倡导对开放教育人员、实践的认可和奖励 将对开放教育工作的认可和奖励需求引入决策层讨论; 展示欧洲及其他地区开放教育获得奖励的优秀案例。 加强图书馆员的能力建设,提高图书馆员的技能,使其更有效地支持教职工和学生开展开放教育 提供工具和资源,以帮助开放教育图书馆员提高相关能力,有效应对数字转型发展; 通过互动,展示欧洲各机构的优秀案例以及他们用于支持活动的开放工具,在互动活动中辅导和培训图书馆员进行开放教育实践。 在欧洲各地促进富有DEI色彩的开放教育计划 提供培训和资源,指导如何创建多样、公平和包容(DEI)的敏感材料,以便服务广布各社区的少数特殊群体。

    发布时间: 2024-04-29

  • 33. 2024年人工智能人才现状分析
    程冰
    2024年2月,英国数据公司Zeki聚焦人工智能生态系统中的人才情况,发布了《2024年人工智能人才现状》(The State of AI Talent 2024)的报告,该报告基于过去10年的人工智能人才数据,结合机器学习和强化学习等技术,描绘了14万人工智能顶尖人才的研究成果和职业路径,揭示了一流人工智能科学家和工程师等人才在全球范围内的流动趋势及其背后原因。 一、全球人工智能人才现状 随着全球企业布局人工智能相关业务,对顶尖人才需求大增。美国五大科技公司虽因人工智能发展迅速,但在人才聘用上面临激烈国际竞争,全球其他大型科技公司雇佣的顶尖人工智能人才数量更多。这些人才跨境流动性高、频繁换职且注重自身价值实现,推动人工智能应用市场化及提升可信度。美国在全球人才市场主导地位渐失,欧洲医疗等行业吸引顶尖人工智能人才数量大幅增加,其他受监管行业也在培养相关人才。能吸引并留住人才的公司将扩大领先优势,加强知识产权保护和内部培训。 二、全球人工智能人才趋势 1. 人才市场两级化:自2015年起,美国大型科技公司引发顶尖人工智能人才争夺潮,形成人才引进国和输出国两级市场,人才流失国家面临技术落后风险。 2. 美国五大科技公司人才流动率高:其曾是人才职业发展快速通道,但高流动率和大规模招聘模式因市场份额下降和成本上升面临挑战。 3. 中型人工智能公司难生存:大型公司主导市场,收购有潜力初创公司,中型公司要么发展壮大要么被收购。 4. 人工智能推动产业转型:汽车、医疗等行业在人工智能驱动下重塑产业生态,医疗行业吸引人才能力指数增长,部分行业则未能吸引顶尖人才。 5. 部分国家人才流失或吸引人才:英国、德国等国吸引人才,印度、西班牙等国人才流失,亚洲和东南亚国家与美国进行人才交换。 三、研究发现 1. 人才竞争的赢家和输家:美国大型科技公司扩张引发人才需求激增,造成全球人才市场失衡,欧洲发达经济体形成两级系统。各国政府意识到风险,部分国家已开始扭转人才净流失局面,人才流向受国家人工智能生态系统影响。 2. 五大科技巨头招聘模式遇挑战:其招聘模式面临竞争加剧导致成本上升压力,因需支持更强计算能力,该模式或难持续。 3. 市场向纵深化和多样化发展:人工智能生态系统将更多样化,大型企业市场份额增长,中型研究组织吸引学术人才但人才流入工业界少,小型公司招聘人才多且具多样性。 4. 人才快速增长的行业:医疗、汽车等行业采用人工智能速度快,欧洲公司在医疗和国防领域招聘人才领先,部分小公司也成功吸引顶尖人才,咨询公司也在加速招聘。 5. 各国人才生态系统调整:人才流失影响国家安全发展,英国和德国扭转局面,法国等国落后,美国科技巨头从印度和以色列大学招聘导致人才流入美国,以色列能留住部分人才,印度则表现不佳。

    发布时间: 2024-11-22

  • 34. 生成式 AI 如何构建更好的抗体
    闫亚飞
    抗体是免疫系统对抗感染的主要武器之一。这些蛋白质已成为生物技术行业的宠儿,部分原因是它们可以被设计成附着在几乎任何可以想象的蛋白质上,从而操纵其活动。但斯坦福大学的计算生物学家 Brian Hie 表示,生成具有有效特性的抗体并对其进行改进优化,涉及“大量的强力筛选”。 为了了解生成式 AI 工具是否可以减少一些繁重的工作,Hie、Kim 团队使用了称为蛋白质语言模型的神经网络。这些类似于构成 ChatGPT 等工具基础的「大型语言模型」。但是,蛋白质语言模型不是被输入大量文本,而是在数千万个蛋白质序列上进行训练。 研究人员已经使用此类模型来设计全新的蛋白质,并帮助以高精度预测蛋白质的结构。Hie 的团队使用了一种蛋白质语言模型——由 Meta AI 的研究人员开发——来建议抗体的少量突变。 在它学习的近 1 亿个蛋白质序列中,该模型只接受了几千个抗体序列的训练。尽管如此,该模型的建议中有惊人的高比例提高了针对 SARS-CoV-2、埃博拉病毒和流感的抗体与其目标结合的能力。 改变批准用于治疗埃博拉病毒的疗法和 COVID-19 疗法可以提高这些分子识别和阻断这些病毒用来感染细胞的蛋白质的能力。(Hie 表示,COVID-19 抗体对 Omicron 及其亚变体无效,人工智能引导的变化不太可能恢复有效性。) Kim 说,许多建议的抗体变化发生在与其靶标相互作用的蛋白质区域之外,这通常是工程工作的重点。他补充说:「该模型所涉及的信息甚至对抗体工程专家来说都是完全不明显的……对我来说,这就是『天哪,这是怎么回事?』时刻。」 「这是人们用来改善抗体的工具。」英国牛津大学免疫信息学研究员 Charlotte Deane 说,「我觉得这真的很酷。」 但她补充说,许多研究人员希望,生成式 AI 不是简单地改进现有抗体,而是能够创造出全新的抗体,这些抗体将与选定的目标结合。 Nabla Bio 的联合创始人 Surge Biswas 说,这种能力可以帮助研究人员开发针对抵抗其他抗体设计方法的分子靶标的药物,该公司正在应对这一挑战。 例如,人工智能可以帮助解决 G 蛋白偶联受体问题,G 蛋白偶联受体是夹在细胞膜中的一类蛋白质,与神经系统疾病、心脏病和无数其他疾病有关。Biswas 说,生成式 AI 还可以帮助设计能够锁定多个目标的抗体药物,例如设计肿瘤蛋白和可以杀死肿瘤的免疫细胞。 斯坦福大学生物工程师 Possu Huang 表示,蛋白质语言模型功能强大,非常擅长优化现有蛋白质,包括抗体。但仅在蛋白质序列上训练的模型可能难以产生识别特定蛋白质的真正新抗体。 研究人员表示他们正在取得进展。2023 年 3 月,位于华盛顿州温哥华的生物技术公司 Absci 的科学家们在 bioRxiv 发布的预印本中报告了他们所说的用 AI 制造新抗体的第一步。他们使用包含蛋白质序列和实验数据的模型,为用于治疗乳腺癌的抗体药物的几个重要区域生成了新设计。

    发布时间: 2023-07-11

  • 35. 早期研究人员的开放科学实践指南
    程冰
    荷兰大学图书馆联盟和荷兰国家图书馆(UKB)与荷兰大学(UNL)、荷兰国家研究数据专业中心和荷兰研究委员会(NWO)共同发布了一本关于开放科学的实用指南。 开放科学 可靠的科学不是仅靠超人智慧的工作,而是一个协作的过程。研究人员依赖并建立在彼此的研究成果上。我们共同构建理论、收集证据和评估同行的研究。然而,只有当我们确切地了解我们的前辈所做的事情时,我们才能建立在他们的工作基础上:他们的方法、相关材料、数据和结果是什么?因此,健全的科学理想上等同于开放科学,其中研究周期的所有阶段都尽可能透明和可访问。 关于本指南 刚开始的研究人员在向开放科学的转变中扮演着重要角色,因此这份指南面向荷兰大学和研究机构的所有学科的博士候选人、研究硕士学生和早期职业研究人员。它旨在陪伴研究人员在他们研究的每个阶段,从准备研究项目和发现相关资源(第2章)到数据收集和分析(第3章),撰写和发表文章、数据和其他研究成果(第4章),以及推广和评估(第5章)。每一章都为您提供了最佳的工具和实践,以便立即实施。您可以在当地的开放科学社区(见第6章)和大学图书馆找到其他研究人员或支持人员。 本指南建立在"开放科学的护照.针对博士生的实用指南"的基础上,由Loek Brinkman,Elly Dijk,Hans de Jonge,Nicole Loorbach,Daan Rutten等人撰写。(Paris, 2020)。 知识共享许可 CC BY-SA 4.0 授权。

    发布时间: 2023-07-11

  • 36. 面向关键核心技术领域的科技情报感知服务体系构建研究
    闫亚飞
    1.构建多主体合作的情报感知体系,实现智慧协同与情报流转 在科技情报感知体系中,情报协同主体始终居于主导地位,在情报感知的生命周期中,情报需求的感知则处于首要地位。早在二战时期,美国社会科学委员会、学术团体、情报领域学者、情报机构就联合建立战略情报局,以此识别国家的情报导向需求,这开创了学界与情报界协同合作的先河。中国科学院文献情报中心刘细文等人认为协同战略情报研究是未来科技情报的首要工作模式。在传统的科技情报协同平台中,领域专家一直处于核心位置。但是对于关键核心技术,仅依靠领域专家可能会存在思维定势及认知偏差等原因导致科技情报感知有误差。再加上关键核心技术本身具有的潜在性、颠覆性等特征使其更加难以被发现与感知,这就需要引入大众智慧,扩大情报响应范围,增强科技情报识别与预测的准确性、全面性、及时性。当然大众智慧并不是指所有群众或网民评选,更多是依靠该领域的长期关注者,人员选取主要包括该领域相关网站的核心用户、该领域的青年学者、企业、工业人员等,同时还应建立信任和激励机制,吸引其他学科领域群体持续广泛的参与。。从协同主体的组织模式出发,情报感知的各主体应形成良好的组织结构。一方面科技管理与决策部门应“下好全国一盘棋”,为关键核心技术的攻关建设国际一流的科技情报服务中心,发挥领导、统筹作用,提升科技情报感知能力;另一方面,其他情报协同主体应保持扁平化设计,彼此间形成横向沟通网络,以平等互惠的原则吸纳不同领域、不同行业的情报机构及人员,以此拓宽情报协同平台的网络结构。总体来说,关键核心技术领域情报感知协同平台的主体主要包括科技智库机构、科技管理部门、领域与战略专家、情报咨询机构及大众群体。由科技管理与决策部门作为主导,科技情报机构作为协同平台的情报枢纽,有效识别国家决策需求,分析关键核心技术的发展态势。同时,科技情报机构还需在协同平台中充分承担情报共享与情报重构的责任,实现不同主体间的情报流通无阻。领域专家与大众间则需实现智慧协同,以此弥补专家所存在的思维定势、晕轮效应等问题。由于关键核心技术本身具有很强的跨学科协同性,高校、科研院所作为主要技术研发机构,在情报协同平台中并非以传统的单兵作战形式,而是以多学科团队交叉形式存在,综合多领域科学团队的情报意见,以扩大高校、科研院所对关键技术的态势感知具有先天优势。 2.打造多源异构的科技情报数据库,实现全源情报挖掘 在情报感知的生命周期中,情报采集是扫描、评估、刻画等过程的前提,在面向关键核心技术的情报感知体系中,情报协同平台在精准识别情报需求后需对所需情报进行采集。对于关键核心技术领域情报感知服务体系中的数据来源,由于关键核心技术所具有的潜在性、前瞻性、应用性等特征,传统情报库信息已经难以应对。因此情报协同平台首先要充分拓宽科技情报的元数据来源,根据原有情报库结合专家、大众智慧以及特定领域网络信息搭建全领域、全类型科技情报知识库。领域网络信息是指特定技术领域的相关信息,既包括专利报告、科技期刊、图书等结构化数据,也包括各技术、新闻等门户网站信息、国外情报、科技等网站信息、知识社交平台信息等非结构化数据。特别是对于关键核心技术的前瞻性特质,各国情报科技部门往往会发布科技前瞻评估报告,如韩国科技评估与规划研究院(KoreaInstituteofScienceTechnologyE valuationandPlanning,KISTEP)公布的《KISTEP十大新兴技术》以及知名咨询公司高德纳(Gartner)每年发布的《十大战略科技发展趋势》等技术报告文件。尽管全领域、全类型的科技情报密度高、容量大,但是由于大国博弈高度情报对抗条件下的开源情报来源的不可靠性逐渐增加,开源情报的欺骗效应也渐渐被用作国际间科技竞争的新型工具。鉴于国防与军事技术的高度敏感性,融合开源情报的全源情报成为国防科技情报研究保障的关键形式 。因此,在针对关键核心技术领域的情报采集过程中需要由开源情报向全源情报逐渐转变,利用全源情报消除开源情报的不确定性。总体而言,情报协同平台既需要打造多源异构的科技情报数据库,也需要将目光转向全源情报的收集与利用,以全源性思维和全源性手段实现对全部情报来源、全部利益相关体、全部情报人员思想等要素的综合考虑和应用,以此加强对潜在关键性技术的感知。 3.设置多重扫描指标,实现关键核心技术情报识别第一,关键核心技术领域指标设定。关键核心技术的形成遵循“10→3→1”收敛轨迹,这表明关键核心技术是逐步遴选收敛出来的。由于情报采集与归纳的多源异构数据与全源情报,其数量庞大、形式多样,如何根据情报需求,确定攻克关键核心技术所需的科技情报是首要任务。目前公认的科技数据扫描方法主要为基于大数据的专家思想碰撞的方式,研究认为对于关键核心技术的隐蔽性及前瞻性,单一指标难以实现精准探测,因此关键核心技术指标的设定应包括广域扫描指标与特定领域扫描指标两种。广域扫描指标用于对多源异构数据库进行初步整体非定向扫描,以便用于专家遴选,根据其作用功能。根据关键核心技术的主要特质和学者们的研究,本文对初级指标的框架进行表述。对于颠覆性指标的设定,研究根据Christensen及栾春娟等等的研究,将其分解为四个维度,这四个维度分别代表了关键核心技术的不同颠覆领域。前瞻性的指标分为该技术是否对行业、技术具有预见作用,能够精准捕捉未来技术的发展态势。垄断性主要是指该技术具有难以模仿的特质,对于情报感知体系来说,还要精准判断该技术的研发能否保持长期垄断以及是否具有较高的垄断价值。潜在性的判别指标是要识别该技术目前的发展现状,是否为潜在性技术,同时该技术的潜在价值如何。夏绪梅等认为关键核心技术具有高投入的特性,同时政府还要判别投入所形成的成果产出,因此本研究将高投入性指标设为投入指标与产出指标。特定指标用于特定技术领域与交叉技术领域评审。由于关键核心技术具有交叉性、融合性、长期性,这需要对某个领域进行长期监测,同时还需多领域专家共同评审。因此该指标需要根据关键核心技术的本质特征与所在领域前沿技术特征相结合,根据不同领域、行业的现状,遴选不同专家进行指标设定。第二,关键核心技术领域数据扫描与识别。根据已设定的技术指标,情报感知体系将根据技术评价指标及专家智慧,对多源数据进行扫描与识别。对于广域技术扫描,其核心在于动态全域监测,监测范围广,监测结果粗度较高。对于特定领域技术扫描,其核心在于智能情报挖掘,识别特定技术领域与交叉技术领域发展态势,要求保持较细粒度。但是无论是广域扫描还是特定扫描,都需要对科技数据进行多轮迭代筛选,以此捕捉技术弱信号。由于地平线等扫描系统主要侧重于技术的热度、突变度等特征,缺乏综合维度的评估,难免存在误差,需要结合专家与大众智慧。即技术数据迭代筛选的过程也是人机协同的过程。因此科技情报数据识别的过程主要包括四个阶段。 a.科技数据初筛选。该过程是机器智慧的集中体现,需要同时对特定领域与非特定领域利用不同指标进行广域扫描。机器智慧首先利用大数据挖掘分析等方法对科技情报数据进行初步整体的非定向扫描,根据突变度、新兴度、热度等维度对潜在技术进行评估,同时根据初步指标对技术进行遴选,将机器识别为关键的技术存至技术清单1。对于特定领域及交叉领域所进行的定向扫描,机器智慧利用特定指标与交叉指标进行技术筛选,对认定为关键的技术存至技术清单2。对于清单2中的技术还需要利用机器智慧绘制技术交叉图谱、演化趋势图,辅助领域专家评审。 b.科技数据再筛选。该过程是专家智慧与大众智慧的集中体现。对于预选技术清单1,领域专家需要联合大众智慧,根据机器智慧所提供的相应技术信息,如技术突变点、研究机构、国家等结合初步指标进行关键技术判定,以此实现第一轮的智慧融入。专家评分后,将保留于清单1中的技术进行二轮迭代,同时在迭代中引入新探测技术。通过技术筛选的不断反复,逐渐完善技术清单1并交至数据平台。对于技术清单2,需要结合特定领域及跨学科的专家团队智慧,该领域专家根据机器提供的技术交叉图谱、演化趋势图进行分析,之后根据特定指标或交叉指标对技术清单2进行审验,发现清单漏洞并对谱系结构、技术演化图谱予以完善,之后进行多轮迭代,最后提交至数据平台。 c.科技数据提交。技术清单1与清单2录入数据平台后,由跨学科团队进行专家审定,验证其科学性,对于存在漏洞的技术清单应反交至上层清单,重新审验。之后根据科技管理部门情报需求按领域、按行业进行情报决策支持并将所需技术清单及相关情报提供给情报协同平台。 d.科技数据归档。即将最终所得技术清单进行分档归类,该过程由情报协同平台完成。情报协同平台需要综合全球核心技术领域知识库、案例数据库等分类原则,建立符合我国科技管理及相关部门所需的重点跟踪科技库和专题科技库。对于归档后的科技情报数据,应该保持定期监测,本文也基于此建立五维监测体系。 4.态势监测与技术演化导航,实现情报刻画与评估情报刻画可以被解释为“以促进感知的形式呈现。”正如钱学森曾说“情报是激活了的知识”。因此,情报刻画与评估便为情报感知的激活与具体展示。在科技情报感知体系中,情报刻画与评估的首要目的是根据扫描与识别的结果绘制关于关键核心技术的情报产品。情报产品主要包括场景模拟、技术监测与技术演变导航与图谱绘制。 4.1技术发展态势监测关键核心技术发展态势的监测包括监测该技术市场潜力、其他国家的应用案例、政策、监管与道德伦理问题等。通过了解海外先进技术最新发展情况,以及国外对该技术的应用政策、技术开发和部署情况,为我国科技管理部门提供决策支撑。事实上,欧盟早已经开展对关键核心技术的态势监测,其主要是从“技术”“领域”“国家”三个维度进行布局,以此实现技术监测。在我国也有学者根据学科分类体系对技术监测进行探讨。本文结合以往学者与国家的研究,建立“国家”“技术”“领域”“技术特质”“技术交叉”的五维监测体系。国家维度包括主要研发国家。对于产业领域维度,国际普遍使用《国际标准产业分类法》,本文依据该法案及欧盟的产业领域分类方法,将产业领域划分为27类。技术维度则为科技情报数据的识别成果,将所识别的关键核心技术归纳于产业领域之中,并发现其中的领域交叉与技术交叉,根据技术交叉绘制演化导航与交叉图谱。技术特征维度用于评估该关键核心技术的全面特征,指标主要使用已构建的交叉指标与特定指标。根据监测体系,还可以实现智能情报检索。比如利用监测体系分析美国在化工产业的关键技术发展现状、国家之间技术领域对比、识别潜在的技术交叉趋势等。 4.2技术演化导航与图谱绘制智能情报是技术演化导航与图谱绘制研究的起源。钱学森先生早在1983年便提出过智能情报的相关观念,并认为情报研究的发展需要长期与智能技术相结合。技术演化导航与图谱绘制是关键核心技术领域情报感知服务体系的主要成果之一。技术演变导航与图谱绘制的重要性在于将不同领域之间技术的交叉融合、技术演变的关键节点、技术分支脉络都予以诠释。对于已归档分类的科技情报数据,动态监测其发展态势是必不可少的程序。黄祥喜等提出构建智能情报检索系统,以此实现技术演变路径的快速导航。但以此方式实现的快速导航具有信息迟滞,同时难以实现更深层次的情报挖掘。本文认为利用场景模拟方法对五维检测体系中的技术演化进行模拟复现是实现导航的有效途径。利用场景模拟方法将分布在时间、空间不同维度的技术导航进行关联,发现潜在新兴交互技术。同时通过多场景模拟,对新兴技术应用的可能性、与其他技术之间的耦合性进行判断,以此提高潜在技术的挖掘。关键核心技术的谱系绘制还有利于分析科技演化路径的拐点、异常点、突变点,针对突变点进行情报搜集以实现预测情报服务。对于场景模拟的方式,则可以尝试众包激励,鼓励大众进行市场模拟或者利用数字孪生技术进行虚拟仿真。 4.5反馈科技需求,实现情报响应情报响应在《情报与文献工作辞典》中被定义为,情报接受者对情报产品的接收情况。在科技情报感知体系中,情报响应既是情报采集、情报扫描、情报刻画、评估的响应,也是将情报产品提供给科技管理部门的响应;既是情报过程的响应也是情报主体间的响应。就情报主体间的响应而言,该过程是情报协同主体根据我国科技决策部门的需求,响应情报感知体系在科技情报采集、扫描、识别、刻画、评估等方面的能力,提前感知“卡脖子”技术问题对我国经济、社会、政治等方面可能造成的影响,形成情报产品并将所生成的情报产品提供给科技决策管理部门,为我国关键核心技术的攻关提供情报需求的过程。通过情报响应,以期加强我国在前沿技术、关键核心技术等方面的科技预测、预测能力,支持我国科技发展决策,避免或减少我国科技安全与发展以及国家整体利益受到侵害。

    发布时间: 2023-07-11

  • 37. LPC发布《图书馆出版伦理框架》2.0版本
    程冰
    LPC发布《图书馆出版伦理框架》2.0版本 LPC 发布图书馆出版伦理框架2.0版。一个专门的工作小组花了两年时间更新了图书馆出版联盟2018年框架。它引导图书馆出版商如何在他们的学科进行伦理思考。 图书馆工作和出版作为独立领域的道德规范已经确立,出版商可以向出版道德委员会(COPE)和其他权威机构寻求道德实践的指导;图书馆员可以依靠国际图书馆协会联合会(IFLA)的道德准则作为道德指导的一个来源,图书馆出版可从两者中得到伦理指导。但作为一个相对年轻的学科,图书馆出版也发现自己正在发展一种不同于其母领域的文化。 该框架包括4部分内容 框架1:图书馆出版以价值为基础 框架2:图书馆出版既是图书馆又是出版事业 框架3:图书馆出版是面向社区的 框架4:图书馆出版是动态的 相关信息可参考链接原文。 LPC 发布图书馆出版伦理框架2.0版。一个专门的工作小组花了两年时间更新了图书馆出版联盟2018年框架。它引导图书馆出版商如何在他们的学科进行伦理思考。 图书馆工作和出版作为独立领域的道德规范已经确立,出版商可以向出版道德委员会(COPE)和其他权威机构寻求道德实践的指导;图书馆员可以依靠国际图书馆协会联合会(IFLA)的道德准则作为道德指导的一个来源,图书馆出版可从两者中得到伦理指导。但作为一个相对年轻的学科,图书馆出版也发现自己正在发展一种不同于其母领域的文化。 该框架包括4部分内容 框架1:图书馆出版以价值为基础 框架2:图书馆出版既是图书馆又是出版事业 框架3:图书馆出版是面向社区的 框架4:图书馆出版是动态的 相关信息可参考链接原文。 LPC 发布图书馆出版伦理框架2.0版。一个专门的工作小组花了两年时间更新了图书馆出版联盟2018年框架。它引导图书馆出版商如何在他们的学科进行伦理思考。 图书馆工作和出版作为独立领域的道德规范已经确立,出版商可以向出版道德委员会(COPE)和其他权威机构寻求道德实践的指导;图书馆员可以依靠国际图书馆协会联合会(IFLA)的道德准则作为道德指导的一个来源,图书馆出版可从两者中得到伦理指导。但作为一个相对年轻的学科,图书馆出版也发现自己正在发展一种不同于其母领域的文化。 该框架包括4部分内容 框架1:图书馆出版以价值为基础 框架2:图书馆出版既是图书馆又是出版事业 框架3:图书馆出版是面向社区的 框架4:图书馆出版是动态的 相关信息可参考链接原文。https://librarypublishing.org/announcing-version-2-0-of-an-ethical-framework-for-library-publishing/

    发布时间: 2023-07-11

  • 38. 哈工大发布大模型思维链推理综述:200+文献全面解析大语言模型思维链推理最新进展
    闫亚飞
    01 引言 思维链,一种通过逐步思考解决问题的方式,在解决复杂推理任务上展现出了惊人的性能,激起了人工智能和自然语言处理领域近年来的广泛研究和关注。 然而,目前缺乏一篇针对思维链及其变体的系统性归纳和总结。针对这一问题,本文对现有思维链相关研究进行了广泛调研,对思维链构造方法、思维链增强方法、思维链结构变体进行了归纳和总结,对思维链前沿应用做出了探讨并对思维链未来潜在研究方向进行展望。 为了与传统链式思维链进行区分,本文提出了泛思维链(X-of-Thought)的概念,其泛指基于思维链核心思想——逐步思考解决问题的方法和变体。在下文中所讨论的思维链均代指广义的泛思维链。我们期望这篇综述能够为研究者和初学者提供参考和启发,激发更多关于思维链推理领域的深入探讨,推动该领域的进一步发展和创新。 02 背景介绍 2.1 范式转换 近年来,随着计算能力的不断提升,大规模语言模型如雨后春笋般涌现,例如 GPT,LLAMA,BLOOM。而随着语言模型规模的不断扩大,涌现出了许多令人惊喜的能力,例如上下文学习和思维链能力。因此,自然语言处理的范式正在从预训练+微调转变为预训练+上下文学习。 2.2 上下文学习和思维链推理 上下文学习(In-context Learning)通过在提示文本中添加输入-输出示例,通过少样本学习(Few-shot Learning)的方式让 LLM 模仿已有示例(demonstrations)解决新的问题。通过上下文学习,LLM 无需额外微调即可使用,并且还能取得不错的性能。尽管如此,其在面对复杂数学推理、常识推理等复杂推理任务时表现不佳。 思维链(Chain-of-Thought)推理要求模型在输出最终答案之前,显式输出中间逐步的推理步骤。这一举措大幅度提高了 LLM 在复杂推理任务上的表现,并且输出的中间步骤方便使用者了解模型的思考过程,提高了大模型推理的可解释性。目前,思维链推理已经成为大模型处理复杂任务的一个常用手段。 03 章节组织 我们将从三个角度介绍思维链相关方法,并且在最后进行了方法间的比较和讨论: 思维链方法(包含思维链构造方法、思维链结构变体、思维链增强方法) 思维链前沿应用(包含工具使用、决策规划、思维链蒸馏——提高小模型推理能力) 未来研究展望(包含多模态思维链推理、可信思维链推理——减少幻觉、思维链理论研究) 04 思维链方法 4.1 思维链构造方式 根据模型进行思维链推理所需的推理链条人工标注程度,我们将其分为手动、自动、半自动三种构造方式。 4.1.1 手动思维链构造 示例中的推理链条完全由人工标注。优缺点:人工标注推理链条具有较高质量,为少样本学习提供了优质的信号。但是人工标注需要较大的人力成本开销,并且会遇到示例选择难以优化、跨任务迁移困难等问题。 4.1.2 自动思维链构造示例中的推理链条完全无需人工标注。具体来说,它分为 Zero-shot CoT 和 Auto CoT 两种方式。前者通过特定的提示文本激发模型在没有示例的情况下生成推理链条;后者则是使用前者零样本生成的推理链条,并结合示例选择策略,通过少样本学习的方式生成推理链条。优缺点:自动思维链构造不需要人工标注极大减少了人工成本,并且由于无需针对任务设定示例,在不同任务间可以方便迁移。但是由于缺少高质量人工标注信号,其性能通常较差,时常会出现事实错误、逻辑错误等幻觉现象。 4.1.3 半自动思维链构造示例中的推理链条少量由人工标注。具体来说,人工标注少量推理链条作为“种子样例”,基于这些种子样例进行拓展得到大量的推理链条,之后通过示例选择通过少样本学习的方式生成推理链条。优缺点:半自动构造方法结合了前二者的优点,在推理性能和人力成本间达到了平衡。少量人工标注提供了高质量的信号从而提高了推理质量,并且自动的推理链条拓展也减少了人工成本,在不同领域间迁移也仅需对种子样例进行重新标注。 4.2 思维链结构变体最原始的思维链是链式结构,并且以自然语言描述中间推理过程。链式结构过于线性,一定程度上限制了它在复杂任务上的能力,为此许多研究对思维链的结构进行了探索。 4.2.1 链结构变体链式结构变体主要针对中间推理过程的形式进行修改。程序语言的执行和复杂数学推理的过程十分契合,一些工作提出使用程序语言代替自然语言,通过生成可执行程序作为推理链条,并执行该程序得到最终推理结果,例如 PAL、PoT。此外还有一些其他形式的中间推理过程,例如 Algorithm-of-Thought 将推理链条替换为算法的执行过程,激发大模型内部使用算法推理的能力,Chain-of-Symbolic 在规划任务中使用符号代替了复杂的环境。 4.2.2 树结构变体链式结构的思维链限制了探索的广度,一些方法显式地构造了树并引入了树搜索算法。结合树结构和树搜索算法可以对不同的推理路径进行探索,并且引入了回溯、自我评估、剪枝的操作,在复杂任务及规划任务上取得优秀表现(Tree-of-Thought)。此外有方法在中间步骤中额外引入了不确定性评估,一定程度缓解了由不确定性带来的推理级联错误(Tree-of-Uncertain-Thought)。 有些方法通过树结构加快推理速度,通过将问题分解成可以平行解决的子问题并行解码,但这种方法仅限于解决简单任务,无法处理复杂推理任务(Skeleton-of-Thought)。然而,当前的树结构变体方法在任务选择上有较大的局限性,并且需要针对任务设定具体的提示指令,这些困难阻碍了它的广泛应用。 4.2.3 图结构变体图结构相较于树引入了更复杂的拓扑结构。Graph-of-Thought 在推理中通过环结构引入了自我修复,并根据图拓扑结构引入了信息聚合,在处理复杂任务时有着更较优秀有的表现,但是其面临着和树结构变体类似的问题,阻碍了它的广泛应用。ResPrompt 通过在提示文本中引入了“残差链接”来连接、聚合不同步骤的推理结果,隐式地引入了推理步骤之间地图结构,可以在数学推理等通用任务上使用,并且取得了优秀的效果。 4.3 思维链增强方法针对思维链进行某一特性的针对性增强,例如添加推理步骤的验证和完善、引入外源知识、问题分解、多次采样并投票、提高效率等。 4.3.1 基于验证和完善大模型在推理过程中往往会出现幻觉现象,例如事实性错误和逻辑性错误。通过引入针对推理过程的验证来获取反馈信号,并根据该反馈讯号对推理进行完善可以一定程度缓解这种现象。一个简单的思路是对推理步骤进行校验,例如通过演绎推理检验前后推理的一致性(Verify-CoT)、对每一个推理步骤进行细粒度的校验(DIVERSE)。 事实性错误通常通过引入知识进行缓解,具体来说分为外源知识和内源知识。对于内源知识,模型在回答问题前,首先通过提示指令获取模型内部的知识,并基于这些知识进行推理(SCREWS、Chain-of-Verification、Crystal、Step-Back Prompting),外源知识的引入将会在后续章节中介绍。对于推理一致性,一些方法通过反向推理进行验证。具体而言,他们根据问题和模型的预测来推理问题中的条件,根据推测出的条件和真实条件的一致性来判断推理的正确性(RCoT、FOBAR、Self-Verification)。 4.3.2 基于问题分解 模型直接回答复杂问题是十分具有挑战性的,而回答简单问题则得心应手。因此将问题分解成子问题显式地一步步解决是一类有效的方法。 Least-to-Most 使用了自顶向下的问题分解策略,首先将问题一次性分解成若干子问题,之后逐个解决从而得到最终的答案;Successive Prompting 采取了一种迭代分解策略,每轮迭代分解一个子问题并解答,并使用其促进后续的问题分解和回答;Decomposed Prompting 采取模块化设计,对不同类型的子问题设计专属模块负责解答,提高了子问题解答的准确性。此外,BINDER 采取神经符号的方式,通过程序执行得到最终答案;DATER 则关注表格推理的问题分解,需要同时考虑问题和表格的分解。 4.3.3 基于外源知识模型内部存储的知识在预训练结束后便会定格,无法获取新的知识,导致知识的匮乏和过时。从维基百科、知识库、词典等途径引入外源知识,能够一定程度缓解这个问题。Chain-of-Knowledge 从知识库中获取结构化知识进行知识指导的推理,并且根据结构化知识对推理链条的真实性和可信性进行验证。KD-CoT 将多跳推理转化为多轮问答形式,在每轮问答中检索相关的事实知识辅助问答。 4.3.4 基于排序或投票由于语言模型是基于概率采样的,在生成文本时会具有一定的随机性,通过多次采样并对采样结果进行集成,可以有效地缓解这个现象,并显著提高推理的性能。一些工作在推理链条或答案层级进行粗粒度的集成,例如 Self-Consistency、Complex CoT、Verifiers。这种集成粒度过粗没有考虑到推理步骤,为此另一些工作考虑到了中间推理步骤进行细粒度的集成,例如 Self-Check、GRACE。除了通过概率进行采样外,Diversity-of-Thought 通过不同的提示文本来采样多跳推理路径。总的来说,基于多次采样的策略已经成为当前思维链推理中常用的技术。 4.3.5 效率提升尽管思维链推理已经展现出卓越的性能,其推理速度慢、使用开销大仍是不可忽视的问题。目前工作从减少推理链条标注成本、加快推理时解码速度和降低推理时的多次采样次数开销入手。 05 思维链前沿应用 5.1 工具使用 虽然大模型具有非常强大的知识水平,其依然缺乏对于时效性内容以及领域外知识的更新能力,并且语言模型在数学计算、符号推理上也较为薄弱,在遇到这些问题时往往会产生幻觉现象。 为此,许多方法探究如何使用外部工具对 LLM 进行增强,通过提示或微调等方式引入使用工具(调用 API)的能力。网页和知识库检索能够让模型获取最新的外部知识,数学计算器与程序执行可以用以处理更为复杂的计算问题,调用其他模型能够获得其他模态(图像、视频、语音)的理解以及生成能力,甚至是与外部环境进行感知与交互,实现具身智能。思维链推理在工具增强方法中起到了非常重要的作用。大多数情况下,模型对于工具调用的需求是隐含的。工具提高了大模型在单步“动作”下的处理能力,而思维链赋予了模型在推理过程中对于问题的分解,工具使用形式的思考以及工具调用结果的追踪处理能力。 5.2 决策规划 思维链提供了一种将问题分解为链式子问题的形式,从而处理较为复杂的问题。然而,对于更为复杂的任务,链式的分解形式并不充分。在前文中,我们介绍了将链式推理拓展到树结构、图结构等形式的工作。 除此之外,LLM+P,LLM+DP 等工作将问题分解为规划领域定义语言(Planning Domain Definition Language, PDDL)的形式,通过外部模块对过程进行规划调度,最终再转换回自然语言形式用 LLM 进行处理。这些方式都提供了更为灵活的分解以及调度过程,增强模型的规划能力。 在长期规划中,模型产生的错误会进行累积。并且在执行过程中可能会遇到计划外的错误,不断进行重试也无法得到正确的结果。因此需要提高模型在推理过程中对错误处理、总结,以及对计划更新的能力。Self-Refine 能够让模型对结果进行自我反馈以及优化,而 Reflexion 在此基础上加入长短期记忆,根据历史经验进行决策。AdaPlanner 等工作则能够根据环境反馈优化规划过程,提高灵活性。规划增强的方法可以与工具增强、多智能体等方法进行结合,进一步增强大模型在复杂问题上的处理能力。 5.3 思维链蒸馏 思维链被视为大模型的一种涌现能力,然而,这种能力在一些规模较小的模型上并不是很显著,限制了小模型在推理时的表现。 当模型具备一定的思维链能力时,可以通过自监督与自我迭代的方法对推理能力进行强化,例如 LMSI,STaR 等。 但大多数情况下,小模型的思维链能力较弱,难以输出可靠的推理过程进行自我蒸馏。此时需要依靠具有较强思维链能力的大模型输出推理链条,再蒸馏给小模型,从而让小模型也获得一定的推理能力。一般来说,蒸馏时需要对数据进行筛选,有答案标签的情况下可以通过标注筛选出结果正确的推理过程,而在没有标注时也能通过 self-consistency 等方式投票得出较为可靠的答案。 除了推理结果的正确性外,推理过程的多样性对于蒸馏的效果也非常重要。SCoTD 发现针对每个样本采样多种推理路径能提高小模型的推理性能,SCOTT 通过对比解码和反事实推理等方式进一步提升思维链质量,缓解小模型学习到推理过程“捷径”的问题。 思维链的形式也会影响小模型的学习效果。DialCoT 将思维链过程拆解为多轮对话的形式,简化小模型的学习难度。MWPCoT 和 PlanningToken 等工作则在数学推理过程中引入高层次的信息表示,提高模型在推理过程中的一致性以及在不同问题上的泛化性。不过需要注意的是,模型在多维度能力上存在着非常复杂的权衡。虽然通过蒸馏和微调的方式可以提高小模型在专一领域的推理能力,这个过程同时会损害模型在其他通用领域的性能(Specializing-Smaller-LM)。 06 思维链未来研究方向 6.1 多模态思维链推理目前的多模态思维链推理主要集中在图文领域,使用小模型进行微调,尚处于早期研究阶段。基于视觉-文本基座大模型和视频推理任务上存在着很大的探索空间。 6.2 可信思维链推理 | 减少大模型幻觉基于大语言模型的思维链推理存在幻觉,如何减少幻觉,实现可信思维链推理是潜在的研究方向。 6.3 思维链理论思维链有着惊人的性能,但其背后的原理和能力边界仍处于未知状态。从理论上探究思维链的能力来源、能力边界以及其相较于上下文学习的优点,可以更好地指导并促进思维链应用。

    发布时间: 2023-12-01

  • 39. 我国算法治理政策法规内容及框架分析--张涛,韦晓霞
    黄雨馨
    张涛,韦晓霞 黑龙江大学信息管理学院,黑龙江 哈尔滨 150080 摘要 [目的/意义] 数智时代算法在经济社会发展过程中发挥了重要作用,算法治理逐渐进入公众视野,算法治理目标的实现必须依靠各种政策法规的组合搭配,对我国算法治理政策法规现状的分析有助于促进算法健康、有序、繁荣发展。[方法/过程] 本文借助Nvivo12质性文本分析软件,以我国12部算法治理政策法规为样本,对其内容进行编码分析,同时提取概括出我国算法治理政策法规框架。[结果/结论] 我国算法治理当前存在缺乏总领性法律引导、主题分布不均衡、行业标准规范不细化、尚无地方专项政策的问题。基于此,本文提出我国应从提升算法治理“力度—深度—精度—广度”入手,逐步将较为零散的算法治理政策法规聚合成为具有中国特色的算法治理政策法规体系。 关键词 算法治理 / 质性文本分析 / 政策文本分析 / 算法治理政策法规

    发布时间: 2023-10-10

  • 40. 类ChatGPT人工智能技术嵌入智慧图书馆:应用价值、潜在风险及防控策略
    于彰淇
    摘要:ChatGPT是人工智能领域的颠覆性成果,引起了社会各界的高度重视。将类ChatGPT人工智能技术嵌入智慧图书馆,对于智慧图书馆的创新与发展具有重要意义。文章采用历史研究法、文献调查法以及理论分析法,在梳理ChatGPT的发展历程及其主要技术特征的基础上,深入分析了类ChatGPT人工智能技术嵌入智慧图书馆的应用价值、潜在风险以及风险防控策略。研究显示,类ChatGPT嵌入智慧图书馆具有提高资源建设质量、优化用户服务体验、实现人员数智赋能、促进管理决策转型等应用价值,同时也存在知识产权保护难度上升、人机互动产生误导冲突、信息安全保护遭受冲击、管理决策过渡依赖技术、复合型馆员有严重缺口等潜在风险。对此,智慧图书馆应制定以下风险防控策略:构建版权协同保护体系、全面构建技术治理机制、完善数据安全保障体系、创新组织领导管理机制以及推动技术人力资源建设。

    发布时间: 2024-01-19

  • 41. 信息来源特征对科学知识采纳的影响研究--石静,吴柯烨,孙建军
    黄雨馨
    信息来源特征对科学知识采纳的影响研究--石静,吴柯烨,孙建军 石静,吴柯烨,孙建军 1. 南京大学数据智能与交叉创新实验室,江苏 南京 210023 2. 南京大学信息管理学院,江苏 南京 210023 摘要 [目的/意义] 科学研究为技术创新提供知识基础,技术创新吸收利用科学知识是重要的技术创新方式。在技术创新过程中被采纳的科学知识,作为基础研究与技术创新的桥梁,其特征对采纳效果的提升发挥着重要作用。前人研究证明,知识的来源特征作为一种便捷的价值呈现方式,会对受众的注意力分配与信息筛选过程产生影响。但这种影响在从科学到技术这一跨界信息传播过程中是否存在、有何表现,仍待探究。[方法/过程] 本研究从专利引用论文的视角探究技术对科学知识的采纳,构建1800—2018年全领域专利引用论文的数据集,测度科学知识的来源特征,分析其分布情况、变化趋势,并进一步构建回归数据集,使用回归模型,探究来源特征对采纳强度、采纳速度、采纳广度的影响。[结果/结论] 结果显示:①科技融合创新成为趋势,创新活动更加精细化,科学知识被技术采纳的速度提升,但广度与强度降低;②科学知识来源特征显著影响采纳效果,来自更高影响力生产者与传播者的科学知识,效果更好;③科学知识的技术采纳过程具有明显的学科领域差异,实践性较强的领域科学知识利用虽然更多、更迅速,但这些知识往往不能产生较强的技术影响力。 关键词 科技创新 / 知识采纳 / 来源特征 / 效果评估 / 专利引用

    发布时间: 2023-10-10

  • 42. 元宇宙场域视角下高校图书馆文献信息资源 创新服务模式研究
    闫亚飞
    高校图书馆的内外部环境处于动态变化之中,其整体需求也随之而变。然而从高校图书馆文献信息资源服务的变革历程来看,需求变革始终围绕着空间、人、资源三要素展开,与此对应的环境需求、用户需求和资源需求是图书馆存在和发展的不竭动力。通过识别高校图书馆文献信息资源服务需求,合理配置高校图书馆各服务要素,能够将高校图书馆打造成跨学科交流中心,形成多门学科资源与用户知识交流的服务生态圈。在此过程中,元宇宙的理念足够创新、技术十分多元,能够打破时空、虚实的界限,进一步统筹高校图书馆空间、人、资源三要素。多维度服务要素的群聚效应则促进了高校图书馆实现物理空间与虚拟空间高度融合、虚拟现实技术与需求高度配合、线上与线下资源高度协调的最终目标,驱动文献信息资源服务产生场域共振,从而提升高校图书馆文献信息资源服务水平。 1空间需求:元宇宙驱动空间环境重塑 图书馆以“空间”为要素历经“借阅空间”“传播空间”“交流空间”的发展和转变,空间要素的变化映射出图书馆适应人的需求和社会环境而做出的改变。由此可知,高校图书馆空间塑造是通过为用户提供舒适的空间体验来提高知识交流的效率。然而高校图书馆实体物理空间的再造成本较高,一般而言,高校图书馆实体空间改造的可变范围较小,通常从功能、环境和布局等层面进行空间重塑,且构建过程中需要充分考虑图书馆的基础服务和升级服务。当下高校图书馆服务仍以传统的书刊借阅和收藏鉴赏为主,师生的活动空间也主要集中于阅览室、自习室等实体空间,难以满足广大读者在移动互联网时代产生的新兴需求。高校师生读者思维转换十分迅速,对科技和信息的反应尤为灵敏,他们亟须一个能提供动态化、多样化、专业化服务的新型图书馆。然而,在已开展的为数不多的高校图书馆虚拟空间构建实践中,空间形态还不够真实,用户沉浸式学习体验需求尚未得到满足。高校图书馆具有支持学科建设的时代任务,利用好元宇宙虚拟现实技术能够开辟图书馆虚拟空间,促进实体物理空间与虚拟交互空间多维度学科知识互动,提高图书馆文献信息资源空间服务的能力。 2 用户需求:元宇宙驱动教学科研服务 高校图书馆是为教学和科学研究服务的学术性机构,其用户主体是在校师生,就该类型用户的需求而言,科研教学、学科专业依然是服务重点。在科研创新方面,数据驱动的新型研究范式使得用户的个性化知识需求日益凸显。高校师生长期从事科学研究工作,需要更加专业化的知识推送服务。因此,图书馆不仅要保障用户在陌生领域检索学科知识的基础需求,还要主动满足用户的多学科知识需求,面向用户多学科或“跨资源”知识需求形成有权重的创新知识点整合网络,为其推荐关联性高的显性知识和承载隐性知识的人才。在教学活动与专业学习方面,多门学科对于虚拟现实技术都有需求。如数理化类学科教学模型实物展示,通过对应的建模软件构建与课堂教学所需实物相同的模型;历史学科交互式虚拟教学软件,重现历史事件与场景;体育类学科模拟技能训练教学场景,其高度沉浸性能提高学习者专注力,免受外界环境干扰,还能规避训练中错误或危险动作带来的伤害。此外,创新成果越来越依赖大量科学实验数据,远程协作、实验研究或其他跨学科创新活动需求也逐步攀升。虚拟实验室系统能够对师生科研活动起到实际支持作用,如地理学科VGE知识平台、生命科学虚拟实验室系统、医学临床药物配方研究室等。在高校图书馆运用元宇宙技术,能够跨越不同专业教师和学生在时间和空间上的距离,把个性化知识服务扩展到网络覆盖到的任何角落,一定程度上能够满足多学科实验教学和科研创新的需求。 3 资源需求:元宇宙驱动学科交叉融合 学科交叉融合是科学研究的重要特征,各高校图书馆需发挥“馆+馆”力量,在资源整合和共享的基础上,实现科研人员的跨学科协同合作等。传统的图书馆资源支持仅立足于通过常规借阅、数字化资源服务实现单向、静态的知识交流;而跨学科资源支持则须为参与到跨学科交流中的师生群体提供各类知识资源,既包括以文献资料为主的各学科显性知识资源,如各类期刊、知识库、案例等“跨资源”,又包括承载隐性知识资源的载体——知识人,如学科专家库、人才库。构建跨学科资源平台,需注重各类知识资源的整合与协同共享。然而,各专业对于文献信息资源数量、来源和种类等要求各有不同,特别是对知识人资源具有远程访问要求。如数字人文领域包含计算机科学、图书情报学、艺术与人文学科、文学、语言学、历史、社会科学等诸多学科,学科之间的联系也越来越密切。随之而来的是跨学科研究者的学科背景和技术水平不一,因此需要虚拟现实互动平台辅助用户进行跨学科、跨专业协作。由此可知,跨学科研究对象的复杂化和研究问题的复合化特征突出,与之相应的大规模的存储处理和计算量需要高性能算力支持和高速率网络辅助。元宇宙3D时空互联网融合了5G泛在网、云存储/DB、云计算/算力等基础支撑技术,能够向场域内用户交付服务器、存储空间、数据库、网络和分析等的资源平台,从而为跨学科协同发展提供数据的存储、安全保护,以及元数据标引、规范化清洗整理、知识挖掘、创建数据关联等数据组织与管理服务网。

    发布时间: 2023-07-11

  • 43. 科技情报感知服务体系构建研究
    闫亚飞
    1.构建多主体合作的情报感知体系,实现智慧协同与情报流转 在科技情报感知体系中,情报协同主体始终居于主导地位,在情报感知的生命周期中,情报需求的感知则处于首要地位。早在二战时期,美国社会科学委员会、学术团体、情报领域学者、情报机构就联合建立战略情报局,以此识别国家的情报导向需求,这开创了学界与情报界协同合作的先河。中国科学院文献情报中心刘细文等人认为协同战略情报研究是未来科技情报的首要工作模式。在传统的科技情报协同平台中,领域专家一直处于核心位置。但是对于关键核心技术,仅依靠领域专家可能会存在思维定势及认知偏差等原因导致科技情报感知有误差。再加上关键核心技术本身具有的潜在性、颠覆性等特征使其更加难以被发现与感知,这就需要引入大众智慧,扩大情报响应范围,增强科技情报识别与预测的准确性、全面性、及时性。当然大众智慧并不是指所有群众或网民评选,更多是依靠该领域的长期关注者,人员选取主要包括该领域相关网站的核心用户、该领域的青年学者、企业、工业人员等,同时还应建立信任和激励机制,吸引其他学科领域群体持续广泛的参与。。从协同主体的组织模式出发,情报感知的各主体应形成良好的组织结构。一方面科技管理与决策部门应“下好全国一盘棋”,为关键核心技术的攻关建设国际一流的科技情报服务中心,发挥领导、统筹作用,提升科技情报感知能力;另一方面,其他情报协同主体应保持扁平化设计,彼此间形成横向沟通网络,以平等互惠的原则吸纳不同领域、不同行业的情报机构及人员,以此拓宽情报协同平台的网络结构。总体来说,关键核心技术领域情报感知协同平台的主体主要包括科技智库机构、科技管理部门、领域与战略专家、情报咨询机构及大众群体。由科技管理与决策部门作为主导,科技情报机构作为协同平台的情报枢纽,有效识别国家决策需求,分析关键核心技术的发展态势。同时,科技情报机构还需在协同平台中充分承担情报共享与情报重构的责任,实现不同主体间的情报流通无阻。领域专家与大众间则需实现智慧协同,以此弥补专家所存在的思维定势、晕轮效应等问题。由于关键核心技术本身具有很强的跨学科协同性,高校、科研院所作为主要技术研发机构,在情报协同平台中并非以传统的单兵作战形式,而是以多学科团队交叉形式存在,综合多领域科学团队的情报意见,以扩大高校、科研院所对关键技术的态势感知具有先天优势。 2.打造多源异构的科技情报数据库,实现全源情报挖掘 在情报感知的生命周期中,情报采集是扫描、评估、刻画等过程的前提,在面向关键核心技术的情报感知体系中,情报协同平台在精准识别情报需求后需对所需情报进行采集。对于关键核心技术领域情报感知服务体系中的数据来源,由于关键核心技术所具有的潜在性、前瞻性、应用性等特征,传统情报库信息已经难以应对。因此情报协同平台首先要充分拓宽科技情报的元数据来源,根据原有情报库结合专家、大众智慧以及特定领域网络信息搭建全领域、全类型科技情报知识库。领域网络信息是指特定技术领域的相关信息,既包括专利报告、科技期刊、图书等结构化数据,也包括各技术、新闻等门户网站信息、国外情报、科技等网站信息、知识社交平台信息等非结构化数据。特别是对于关键核心技术的前瞻性特质,各国情报科技部门往往会发布科技前瞻评估报告,如韩国科技评估与规划研究院(KoreaInstituteofScienceTechnologyE valuationandPlanning,KISTEP)公布的《KISTEP十大新兴技术》以及知名咨询公司高德纳(Gartner)每年发布的《十大战略科技发展趋势》等技术报告文件。尽管全领域、全类型的科技情报密度高、容量大,但是由于大国博弈高度情报对抗条件下的开源情报来源的不可靠性逐渐增加,开源情报的欺骗效应也渐渐被用作国际间科技竞争的新型工具。鉴于国防与军事技术的高度敏感性,融合开源情报的全源情报成为国防科技情报研究保障的关键形式 。因此,在针对关键核心技术领域的情报采集过程中需要由开源情报向全源情报逐渐转变,利用全源情报消除开源情报的不确定性。总体而言,情报协同平台既需要打造多源异构的科技情报数据库,也需要将目光转向全源情报的收集与利用,以全源性思维和全源性手段实现对全部情报来源、全部利益相关体、全部情报人员思想等要素的综合考虑和应用,以此加强对潜在关键性技术的感知。 3.设置多重扫描指标,实现关键核心技术情报识别第一,关键核心技术领域指标设定。关键核心技术的形成遵循“10→3→1”收敛轨迹,这表明关键核心技术是逐步遴选收敛出来的。由于情报采集与归纳的多源异构数据与全源情报,其数量庞大、形式多样,如何根据情报需求,确定攻克关键核心技术所需的科技情报是首要任务。目前公认的科技数据扫描方法主要为基于大数据的专家思想碰撞的方式,研究认为对于关键核心技术的隐蔽性及前瞻性,单一指标难以实现精准探测,因此关键核心技术指标的设定应包括广域扫描指标与特定领域扫描指标两种。广域扫描指标用于对多源异构数据库进行初步整体非定向扫描,以便用于专家遴选,根据其作用功能。根据关键核心技术的主要特质和学者们的研究,本文对初级指标的框架进行表述。对于颠覆性指标的设定,研究根据Christensen及栾春娟等等的研究,将其分解为四个维度,这四个维度分别代表了关键核心技术的不同颠覆领域。前瞻性的指标分为该技术是否对行业、技术具有预见作用,能够精准捕捉未来技术的发展态势。垄断性主要是指该技术具有难以模仿的特质,对于情报感知体系来说,还要精准判断该技术的研发能否保持长期垄断以及是否具有较高的垄断价值。潜在性的判别指标是要识别该技术目前的发展现状,是否为潜在性技术,同时该技术的潜在价值如何。夏绪梅等认为关键核心技术具有高投入的特性,同时政府还要判别投入所形成的成果产出,因此本研究将高投入性指标设为投入指标与产出指标。特定指标用于特定技术领域与交叉技术领域评审。由于关键核心技术具有交叉性、融合性、长期性,这需要对某个领域进行长期监测,同时还需多领域专家共同评审。因此该指标需要根据关键核心技术的本质特征与所在领域前沿技术特征相结合,根据不同领域、行业的现状,遴选不同专家进行指标设定。第二,关键核心技术领域数据扫描与识别。根据已设定的技术指标,情报感知体系将根据技术评价指标及专家智慧,对多源数据进行扫描与识别。对于广域技术扫描,其核心在于动态全域监测,监测范围广,监测结果粗度较高。对于特定领域技术扫描,其核心在于智能情报挖掘,识别特定技术领域与交叉技术领域发展态势,要求保持较细粒度。但是无论是广域扫描还是特定扫描,都需要对科技数据进行多轮迭代筛选,以此捕捉技术弱信号。由于地平线等扫描系统主要侧重于技术的热度、突变度等特征,缺乏综合维度的评估,难免存在误差,需要结合专家与大众智慧。即技术数据迭代筛选的过程也是人机协同的过程。因此科技情报数据识别的过程主要包括四个阶段。 a.科技数据初筛选。该过程是机器智慧的集中体现,需要同时对特定领域与非特定领域利用不同指标进行广域扫描。机器智慧首先利用大数据挖掘分析等方法对科技情报数据进行初步整体的非定向扫描,根据突变度、新兴度、热度等维度对潜在技术进行评估,同时根据初步指标对技术进行遴选,将机器识别为关键的技术存至技术清单1。对于特定领域及交叉领域所进行的定向扫描,机器智慧利用特定指标与交叉指标进行技术筛选,对认定为关键的技术存至技术清单2。对于清单2中的技术还需要利用机器智慧绘制技术交叉图谱、演化趋势图,辅助领域专家评审。 b.科技数据再筛选。该过程是专家智慧与大众智慧的集中体现。对于预选技术清单1,领域专家需要联合大众智慧,根据机器智慧所提供的相应技术信息,如技术突变点、研究机构、国家等结合初步指标进行关键技术判定,以此实现第一轮的智慧融入。专家评分后,将保留于清单1中的技术进行二轮迭代,同时在迭代中引入新探测技术。通过技术筛选的不断反复,逐渐完善技术清单1并交至数据平台。对于技术清单2,需要结合特定领域及跨学科的专家团队智慧,该领域专家根据机器提供的技术交叉图谱、演化趋势图进行分析,之后根据特定指标或交叉指标对技术清单2进行审验,发现清单漏洞并对谱系结构、技术演化图谱予以完善,之后进行多轮迭代,最后提交至数据平台。 c.科技数据提交。技术清单1与清单2录入数据平台后,由跨学科团队进行专家审定,验证其科学性,对于存在漏洞的技术清单应反交至上层清单,重新审验。之后根据科技管理部门情报需求按领域、按行业进行情报决策支持并将所需技术清单及相关情报提供给情报协同平台。 d.科技数据归档。即将最终所得技术清单进行分档归类,该过程由情报协同平台完成。情报协同平台需要综合全球核心技术领域知识库、案例数据库等分类原则,建立符合我国科技管理及相关部门所需的重点跟踪科技库和专题科技库。对于归档后的科技情报数据,应该保持定期监测,本文也基于此建立五维监测体系。 4.态势监测与技术演化导航,实现情报刻画与评估情报刻画可以被解释为“以促进感知的形式呈现。”正如钱学森曾说“情报是激活了的知识”。因此,情报刻画与评估便为情报感知的激活与具体展示。在科技情报感知体系中,情报刻画与评估的首要目的是根据扫描与识别的结果绘制关于关键核心技术的情报产品。情报产品主要包括场景模拟、技术监测与技术演变导航与图谱绘制。 4.1技术发展态势监测关键核心技术发展态势的监测包括监测该技术市场潜力、其他国家的应用案例、政策、监管与道德伦理问题等。通过了解海外先进技术最新发展情况,以及国外对该技术的应用政策、技术开发和部署情况,为我国科技管理部门提供决策支撑。事实上,欧盟早已经开展对关键核心技术的态势监测,其主要是从“技术”“领域”“国家”三个维度进行布局,以此实现技术监测。在我国也有学者根据学科分类体系对技术监测进行探讨。本文结合以往学者与国家的研究,建立“国家”“技术”“领域”“技术特质”“技术交叉”的五维监测体系。国家维度包括主要研发国家。对于产业领域维度,国际普遍使用《国际标准产业分类法》,本文依据该法案及欧盟的产业领域分类方法,将产业领域划分为27类。技术维度则为科技情报数据的识别成果,将所识别的关键核心技术归纳于产业领域之中,并发现其中的领域交叉与技术交叉,根据技术交叉绘制演化导航与交叉图谱。技术特征维度用于评估该关键核心技术的全面特征,指标主要使用已构建的交叉指标与特定指标。根据监测体系,还可以实现智能情报检索。比如利用监测体系分析美国在化工产业的关键技术发展现状、国家之间技术领域对比、识别潜在的技术交叉趋势等。 4.2技术演化导航与图谱绘制智能情报是技术演化导航与图谱绘制研究的起源。钱学森先生早在1983年便提出过智能情报的相关观念,并认为情报研究的发展需要长期与智能技术相结合。技术演化导航与图谱绘制是关键核心技术领域情报感知服务体系的主要成果之一。技术演变导航与图谱绘制的重要性在于将不同领域之间技术的交叉融合、技术演变的关键节点、技术分支脉络都予以诠释。对于已归档分类的科技情报数据,动态监测其发展态势是必不可少的程序。黄祥喜等提出构建智能情报检索系统,以此实现技术演变路径的快速导航。但以此方式实现的快速导航具有信息迟滞,同时难以实现更深层次的情报挖掘。本文认为利用场景模拟方法对五维检测体系中的技术演化进行模拟复现是实现导航的有效途径。利用场景模拟方法将分布在时间、空间不同维度的技术导航进行关联,发现潜在新兴交互技术。同时通过多场景模拟,对新兴技术应用的可能性、与其他技术之间的耦合性进行判断,以此提高潜在技术的挖掘。关键核心技术的谱系绘制还有利于分析科技演化路径的拐点、异常点、突变点,针对突变点进行情报搜集以实现预测情报服务。对于场景模拟的方式,则可以尝试众包激励,鼓励大众进行市场模拟或者利用数字孪生技术进行虚拟仿真。 4.5反馈科技需求,实现情报响应情报响应在《情报与文献工作辞典》中被定义为,情报接受者对情报产品的接收情况。在科技情报感知体系中,情报响应既是情报采集、情报扫描、情报刻画、评估的响应,也是将情报产品提供给科技管理部门的响应;既是情报过程的响应也是情报主体间的响应。就情报主体间的响应而言,该过程是情报协同主体根据我国科技决策部门的需求,响应情报感知体系在科技情报采集、扫描、识别、刻画、评估等方面的能力,提前感知“卡脖子”技术问题对我国经济、社会、政治等方面可能造成的影响,形成情报产品并将所生成的情报产品提供给科技决策管理部门,为我国关键核心技术的攻关提供情报需求的过程。通过情报响应,以期加强我国在前沿技术、关键核心技术等方面的科技预测、预测能力,支持我国科技发展决策,避免或减少我国科技安全与发展以及国家整体利益受到侵害。

    发布时间: 2023-07-11

  • 44. 《论数据要素市场》:建设数据要素大市场
    程冰
    当前,数据要素市场建设已成为业界高频讨论的现象级重大课题。从战略思考到制度建设,从政策设计到技术供给,从场景拓展到商业模式,从市场导向到国家权利等等诸多领域不一而足,都不乏诸多研究者参与者。各位看到的这本专著,最基本的特色则是前瞻性、体系化和实践性。 我与作者即国家信息中心大数据部主任于施洋博士和另外两位博士已认识多年了,知道他们持续地深度参与研究并体验关于数据要素流通制度建设预研、数据交易所(中心)设计及创新实验等重要工作,坚持将完成主管部门交办(或地方政府委托任务)和超前开展前沿课题研究有机结合起来,逐步在数据要素市场领域形成了体系化的理论思考和实践总结。对作者们的不懈努力和专业水平以及责任担当我都比较熟悉,故欣然接受邀请写下这份序言。 细读此书总的体会主要有两点。 第一点是观念观点体现科学创新。如作者提出,将数据要素纳入收入分配体系,就如同改革开放以来每一次确立新的生产要素并纳入收入分配体系类似,如土地进入市场拍卖、劳动力商品化、建立资本市场等,都是一场牵涉经济社会发展方方面面的全局性改革。这就是把握数据要素市场发展大趋势的一个新的视角,就是必将催生和发展新的生产力,同时必将调整和完善生产关系。 再如,文中讨论数据要素与其它生产要素关系时,明确指出全要素数字化的过程,是重构原有产业的资源配置状态,实现互联网等数字化新技术与实体经济协同发展充分融合,推动形成智能化的数字经济体系的过程。这就启示我们,加速推进数字化新技术的研发与成果转化并壮大数字经济进程,必须与加速推动工业、农业和服务业现代化,以及社会治理现代化进程互为条件、有机融合。 再如,作者讨论数据要素问题时,提出应基于数据“动态本体论”分析框架,建立政企融合的全国一体化数据要素市场的基本思路,并据此率先提出“所商分离”“数据商”“数据资产入表”等一系列模式和理念,对指导实际工作具有较强实用性可操作性。 第二点是着力构建逻辑自洽体系。数据要素市场化是一个领域新、任务重、困难多、耗时长的事情,应该允许在局部地区、部分环节先行先试。同时,更需要在总体思路和基本路线图上提出一些“先知先觉”的基本思考。 我认为,作者着力论证的包括数据要素的产权体系、供给体系、流通体系、定价体系、核算体系、分配体系和跨境体系,就是谋求理论创新体系化的一大贡献。同时,所论七大体系之间以及各体系内各节之间,都在内容上既有明确界定,又显示相互关联;既有利于研究和实践工作者专注重点领域重点专业发展,又有利于主管部门在基本制度建设及总体政策设计时统筹及统一各方面内在逻辑关系。 当然,无论国内国际,对于数据要素市场都有许多待解问题,希望本专著作者们还要继续“论”下去。就我而言,也一直在寻求对一些问题的答疑解惑。比如,数据要素纳入生产和收入分配体系是必然趋势,这就必须厘清数据资源要素化、资产化和资本化的内涵与外延以及紧密关联的权责利关系,理论上搞清楚十分重要。 又如,数据这一新型要素的复用性极强,特别是可通过交易来持续增加使用价值实现场景和价值,这正是数据资源纳入要素的核心和魅力。但现在全国数十个数据交易场都采取的挂牌或协议交易方式,是无法实现数据要素市场化配置本质要求的,应认真讨论是否需要建立具有金融属性的数据要素资本市场?路径是什么? 再如,数据流通交易过程中,我认为最难的问题不是数据保护,而是数据权益界定(包括再交易过程)基础上形成市场定价体系,可否研究实施利用成熟技术手段(如区块链和数据资产图谱体系)来建立合规合法合理的价格形成机制?(本文来源于人民出版社出版的《论数据要素市场》。本文作者系国家信息中心原党委书记、常务副主任。)

    发布时间: 2023-07-11

  • 45. 调整论文格式可改善 AI 描述
    程冰
    2023年11月28日Nature新闻发布了Terence Day学者的一篇文章,他认为改变现有论文的风格可改善大模型的描述质量,减少大模型引入的错误。 ChatGPT 和其他基于大型语言模型(LLMs)的工具均提高科学研究效率,但在描述研究论文时也会引入错误(Nature 622,234-236; 2023),他建议对论文格式做一些小的改变,可以提高大型语言模型的训练质量。 例如,描述研究方法而不是引用参考文献,将使大型语言模型能够准确地总结方法。用第三人称写作可更清楚地识别个人,这需要传统科学写作风格的重大转变,但大型语言模型并不认识“我们”是谁。Terence Day建议只使用 DOI,没有期刊标题、卷和页码,DOI 使得验证引用更加容易。 大型语言模型为论文提供以第三人称和新闻风格撰写的扩展摘要,可改进人工智能生成的文献综述。这样的摘要将比传统摘要更有效突出工作的重要性,还提高机器和人类的可读性,有助于提高科学研究的社会意识。 以上为图情门户项目组编译,如需转载请注明出处。

    发布时间: 2023-12-01

  • 46. 从 ChatGPT 看生成式 AI 对情报学研究与实践的影响
    闫亚飞
    一般地,情报学理论范式指导情报实践工作。有研究将情报学理论范式分为 4 种,并阐释了每种范式下的情报工作重点和发展趋向,分别是:泛信息论范式下的知识管理与综合性知识服务;学术信息服务范式下的信息检索与服务;决策情报服务范式下的战略情报支持;社会信息服务范式下的企业 竞争情报、社会情报、舆情传播等。鉴于这4种范式较为全面地覆盖了情报实践工作的内容,因此本文将以此为视角,分析生成式AI将对情报实践产生的影响。 1.  拓宽知识资源建设渠道,打造知识服务新生态 知识服务是各类情报机构的一项重要职能,而智慧型知识服务是人工智能时代的产物。生成式AI又将推进智慧型知识服务向高级阶段的进化。从知识生产层面,传统的知识资源多出自出版社、数据库商以及情报机构的自建数据库和知识库。生成式AI的出现将拓宽情报机构知识资源建设的渠 道,AI辅助用户内容创作、AI自动生成内容成为 新的知识生产模式。一方面,每个用户可参与到知 识生产过程中,通过AI辅助获取知识创作的灵感、素材,由AI生成文本、图像、代码、3D模型等多模态知识,实现内容续写、跨模态内容生成( 文字 合成图片或视频等),可极大提升用户体验;另一 面,生成式AI能够通过学习数据的底层模式再自动生成新内容。但就目前最先进的生成式AI技术ChatGPT而言,一大特点就是无法保证生成内容的准确性,这与知识的属性相斥。近期发表在Nature上的文章《ChatGPT:五大优先研究问题》中,研究者指出,ChatGPT 被用于科学界,必须要 坚持人类审查的原则。这无疑对情报机构提出 了新的挑战,即缺少前端的专家审核,情报机构需要承担对AI生成知识内容的人工审核与质量把控 的任务。从知识服务层面,随着元宇宙概念的提 出,情报服务机构致力于构建结合 AR、VR、人工智能等技术的超现实空间与现实空间融合的虚实共生的知识服务场景,而生成式 AI 技术也将为此贡献巨大力量,比如利用AIGC生成虚拟人或数字人,利用“ChatGPT+虚拟人”技术打造人机交互新入口,为用户提供沉浸式、立体化知识体验,有助于拓宽情报机构知识服务的范畴,构建知识服务新生态。 2.  塑造学术信息检索新范式,优化学术信息服务模式 ChatGPT的出现对搜索引擎业务构成了较大威胁,但百度指出生成式AI并不能替代搜索引擎,两者是一种互补的关系,并提出了融合两者功能的“生成式搜索”概念,这对情报领域的学术信息搜索发出了信号。一方面,针对以 Web of Science、中国知网、情报机构自建知识库等为代表的学术信息搜索平台,如果借鉴ChatGPT与WebGPT的联动效应,将生成式AI整合至学术搜索平台中,使其实时根据数据库内容更新,生成的内容参考了某篇学术论文则注明其来源。用户关于某一研究主题 得到的检索结果将不仅是文献列表,也能呈现由生成式AI筛选、整合、总结生成的文献综述,又或是根据读者描述的研究思路,基于对海量文献中图表、图像数据的学习,生成技术路线图以供参考,甚至是针对某领域的研究成果,利用生成式AI抽取细粒度知识,自动生成学术知识图谱,把复杂的关 联研究直观地呈现给读者,以交互式问答方式回答读者的问题,并通过连续对话提升读者体验;另一方面,对于学术科研互动社区,生成式AI在学习了 科研用户海量的问答数据之后,可针对用户搜索或提问生成答案。由此可以预测,生成式 AI 将会重塑 学术信息检索新范式,有助于优化信息服务模式, 但其能力边界与训练时被投喂的数据数量、质量、丰富度有很大关系,这将是情报实践工作中着重考 虑的问题。此外,最重要的是,基于 AI 的学术信息 服务需在明确的使用规范前提下开展,避免被错误和虚假信息误导而产生学术不端等后果,这一问题 正是当前学术圈讨论的热点。 3.  挑战决策情报服务体系,驱动情报效能提升 决策支持服务是情报工作的一项重要内容,主要面向国家科技战略、产业发展与产业结构政策、学科发展等战略决策型关键问题,通过文本挖掘、科学计量等方法深度剖析科技发展态势、学科演化、政策布局,形成战略咨询报告。ChatGPT 发布 以后,被尝试用于生成行业分析报告、市场调研报 告等。其使用了来自人类反馈的强化学习方案,具备良好的思维链能力,能够针对特定问题自主生成解决方案。虽然从目前来看,生成的报告内容仍然 不够专业可信,并不能直接用于指导决策,但随着不断地反馈学习以及模型算法的优化,性能会极大地提升。这对面向决策支持的情报服务产生了较大的冲击和挑战,然而并不会完全取代情报人员的工作,而是作为辅助工具加速推进决策支持服务的智能化,驱动情报效能的提升。因为,即便是在Zero-shot设置下执行下游任务,也需要向AI输入提示。换言之,在决策支持服务中,最基本也是最重 要的环节是情报分析对象、方向、预期的情报产物 形式与内容(比如战略报告的框架)的确定,生成 式AI仅作为辅助情报分析与内容生成的工具,前提是情报人员向其输入合适的问题,这意味着情报人员需要对用户需求有深刻的理解并承担情报产品 的设计工作。从另一方面来看,生成式AI有助于将情报人员从琐碎的分析、撰写任务中解放出来,更多地投入创新性研究工作中。比如,在利用科学计量学分析方法辅助制定科技发展战略规划时,AI可以依据已有的理论和方法,针对特定问题基于数据挖掘生成分析报告,但探索计量学新理论、新律,具体到更加科学有效的新的指标体系构建等创造性工作中,仍然需要专业人员的深入研究和持续创新。 4.  增加社会信息服务压力,凸显情报价值引领 在社会信息服务范式下,情报工作在企业竞争情报服务、安全情报服务、舆情风险预警与治理、数据治理等领域发挥着重要作用。生成式AI在赋能情报收集、处理与分析的同时,也会带来一系列负面影响,增加情报服务的压力。比如,在社会安全和舆情治理方面,ChatGPT可能会成为谣言制造者或舆论引导者的辅助工具,在一些误导性、充斥阴谋论的提问下大量改编信息,引导社会舆论向片 面、极端的方向发展。这在一定程度上会加大风险的情报感知与情报预警的难度。在数据治理方面,近年来关于科研大数据治理、企业大数据治理、政府大数据治理等问题愈发重要,治理的维度涉及数据安全、数据标准、数据质量等。伴随着 ChatGPT等生成式AI的快速发展,海量AI生成数据涌向经济、科研、政务等各个领域,由此带来的数据治理 压力是巨大的。从生成式AI模型的工作原理来看,生成数据的质量取决于训练时被投喂的数据质量和输入提示的有效性。因此,数据治理不仅涉及到AI创造的内容,同样涉及训练数据和提示数据。可以预见,情报学在数据治理领域将面临较大挑战,具体包括AI生成数据的质量管理、标准化、数据归类、数据产权归属等各类问题。然而,从另一个角度来看,生成式AI在增加社会情报服务压力的同时,也更加凸显情报的价值和社会效用,如 何充分发挥情报在综合研判、监测预警、信息汇聚 与治理等方面的作用,更好地服务社会发展,是情报工作在AI冲击下保持优势地位的关键。

    发布时间: 2023-07-11

  • 47. 全球开放获取转换实践及其对我国高校图书馆的启示
    杨小芳
    [目的/意义]  高校在全球开放获取转换进程中扮演着重要角色,开展我国内地高校图书馆开放获取转换实践及其影响研究,对于完善学术公共资金支出政策、提高公共利益参与博弈和制衡能力、参与国际开放获取出版规则的制定、构建良好学术信息生态等具有重要的参考价值和战略意义。 [方法/过程]  从开放获取转换背景和ESAC登记转换协议入手,分析ESAC登记转换协议总体情况、重要转换机构和重要出版社分布、主要转换类型等,通过网络调查、在线问卷、电话访谈等方式开展我国内地高校图书馆开展开放获取转换实践及其影响调查。 [结果/结论]  受经济发展水平、购买力等因素影响,数据库订阅价格在不同国家和地区存在一定差异,然而目前全球差异化的开放获取出版费用体系尚未形成。如何调整折扣和豁免计划,以使作者能够更公平地获得开放获取出版权益,是现有开放获取出版模式可持续发展的关键所在。因此,深入开展开放获取相关知识的宣传与普及,争取科研管理部门和科研人员对开放获取出版及转换的支持,持续关注国内外转换进展,向已实施开放获取转换的机构开展调查,结合我国国情开展转换路径、应对策略等理论和实证研究,是我国高校图书馆推动开放获取进程的有效途径。

    发布时间: 2023-12-01

  • 48. 中科大江俊团队自主研发Chem-GPT,改变传统化学研究范式,解放化学家双手
    黄雨馨
    近日,中国科学技术大学化学与材料科学学院江俊团队自主研发 Chem-GPT——一款化学领域的聊天机器人程序。 Chem-GPT 由化学数据驱动,并结合人类化学家的知识进行机器学习训练,能够针对使用者提出的问题,给出初步的实验建议。基于开源的 GPT 代码,目前阅读了 50 万化学论文,可以基于论文知识来回答化学问题、建议实验方案,驱动机器化学家「小来」做实验,解决化学品和新材料的研发问题。 Chem-GPT 通过阅读 50 万篇化学论文,响应使用者提出的化学问题。 1. 大胆假设:基于文献数据,给出初步实验建议; 2. 小心求证:驱动机器化学家「小来」做实验与模拟; 3. 精准预测:针对实验与理论数据归纳总结; 4. 解决问题反馈优化方案驱动实验验证。,时长02:33以芬顿催化剂为例Fenton(芬顿)是众多的以人名命名的无机化学反应之一。 芬顿反应是一种无机化学反应,过程是过氧化氢(H2O2) 与二价铁离子 Fe2+ 的混合溶液将很多已知的有机化合物如羧酸、醇、酯类氧化为无机态。反应具有去除难降解有机污染物的高能力,在印染废水、含油废水、含酚废水、焦化废水、含硝基苯废水、二苯胺废水等废水处理中有很广泛的应用。 芬顿催化剂又叫芬顿催化氧化填料,芬顿填料,它在传统芬顿反应的基础上,将芬顿反应所需的铁氧化物通过特殊方法附着在载体表面,形成有效的芬顿催化剂。 问:什么类型的非贵金属元素常用于芬顿催化剂? Chem-GPT 的结果其实就来自于江俊团队开发的化学文献机器阅读系统,该系统内置了自然语言处理模型,通过阅读数千篇芬顿催化剂相关文献,可以很快统计出文献中出现频次最多的非贵金属元素。 化学文献机器阅读系统。文献中出现频次最多的非贵金属元素。除了对数量进行统计,该系统还能进行元素协同分析来帮助我们选择最佳的元素组合。 最佳的元素组合。 Chem-GPT 能从文献的精确分析中学习到正确的知识,并不是仅仅基于语言的关联性,因此它给出的答案保证了严谨与准确性。 接下来,就可以调出机器化学家操作系统中保存的芬顿催化剂实验模板,并根据 Chem-GPT 推荐的元素组合编辑液体进样站的参数,让机器获取家小来帮助我们进行实验验证。 就这样,小来开始了愉快的芬顿催化剂创制之旅。化学文献机器阅读系统化学文献机器阅读系统基于 Word2Vec 与机器学习算法,结合语法距离分析方法,根据关键词,从文献中抽取化学关系,包括 Alloy 和 Organic molecule 两种任务。程序使用说明如下: 1. 数据准备:目前系统支持两种格式数据:一是 TSV 文件格式,需要从 Web of Science 网站上下载,方法如下:进入 Web of Science 网站,根据关键词检索文献后,以制表符分隔符的形式导出,具体步骤见下图所示。 二是 PDF 格式文件格式,支持任意 PDF 格式论文。 2. 数据准备完成后,点击页面新建任务按钮,进入新建任务页面; 3. 在新建任务页中填写任务名称、抽取的分子类型、上传准备的数据、填写关键词信息,其中点击可添加多个关键字; 当抽取的任务类型为 ALLOY 时,需指定目标元素在元素周期表上的周期,当需抽取的任务类型为有机分子, 则无需选择。 4. 填写完成后,提交任务,等待任务排队完成,即可获取最终化学关系抽取结果。机器化学家2021 年 6 月,在 2021 北京智源大会《科学智能》专题论坛上。中国科学技术大学化学物理系江俊教授作了题为「分子光谱与材料构效关系的机器学习研究」的演讲。 江俊表示:「上个月,中国科学技术大学研究人员提出「机器化学家」这个概念。我从鄂维南院士提出的『AI for Science——从理论模型得到可靠的数据,再从数据得到有效的模型』得到了启示,修改了我之前的思路,并拿到了项目。」「机器化学家」将帮助人类科学家突破思维局限,从融合了底层规则的数据中,学习建立有效的复杂模型,指导化学实践。 就在项目启动一年后,在中国科学院「数据驱动的化学、材料和生物科学的机器科学家」青年团队计划和国家自然科学基金委项目的资助下,江俊教授团队通过开发和集成移动机器人、化学工作站、智能操作系统、科学数据库,研制出数据智能驱动的全流程机器化学家。,时长02:02这个神奇的「机器化学家」是全球首个数据智能驱动的全流程机器化学家平台。 当然,「机器化学家」并只是一年就可以完成的,这是中国科学技术大学化学与材料科学学院教授罗毅、江俊团队经过八年攻关研制出的。 相关研究成果以「An all-round AI-Chemist with a scientific mind」为题,于 2022 年 9 月发表在《国家科学评论》(Natl.Sci.Rev.)上。 论文链接:https://academic.oup.com/nsr/article/9/10/nwac190/6694008「机器化学家」由「化学大脑」、机器人实验员和智能化学工作站三部分组成。其中最核心的「化学大脑」通过分析大量化学实验和理论数据建立知识图谱,实现了阅读理解文献、设计化学实验、自主优化方案的能力,并配备了人机交互的操作系统,可以便于「无编程基础」的科研用户使用。机器人实验员和 16 个化学工作站之间能进行数据交换和互动,精准配合执行化学实验。 业内专家认为,机器化学家的研究工作脱离了传统试错研究范式的限制,展现出「最强化学大脑」指导的智能新范式的巨大优势,引领化学研究朝着知识理解数字化、实验操作指令化、材料创制模板化的未来趋势前进,确立了我国在智能化学创新领域的全球领跑地位。 全球首个数据智能驱动的全流程机器化学家。就在本月,江俊团队首次将数据驱动自动合成、机器人辅助可控合成、机器学习促进逆向设计,用于胶体纳米晶(例如钙钛矿)材料合成,探索构建了「机器科学家」平台,有望将科研人员从传统试错实验、劳动密集型表征中解放,聚焦科学创新,实现纳米晶材料数字智造。 该研究以「A robotic platform for the synthesis of colloidal nanocrystals」为题,于 2023 年 3 月 2 日发布在《自然-合成》(Nature Synthesis)上。 论文链接:https://www.nature.com/articles/s44160-023-00250-5「这主要得益于中国科大多学科交叉的背景,促使不同学科的科研人员汇集在一起共同做一件事。我们的目标是建成机器化学家大科学装置,解放化学家双手,加快新的化学品和新的材料研发创制。」江俊教授说。 未来蓝图:改变传统化学研究范式,解放化学家双手 对于未来,江俊教授希望他们可以建成一个「机器化学家」大科学装置:在一整栋大楼里,布置上百个机器人、上千个智能化学工作站。一边,全国的化学家、材料学家只需在网上提交自己的任务;另一边,团队成员通过智能操作系统分时安排机器人完成任务,最后将方案反馈给化学家们。 基于这样一个大平台,各个课题组的实验数据可以交汇、共享,产生海量数据,实现自动提炼出数字化的知识图谱和人工智能的模型,进而指导机器人自动优化产生更好、更高效率的化学品或新材料。而且在完成各个实验过程中,机器人通过与科研人员互动,默默学习人类的操作逻辑、思维模式,很有可能在若干年之后,机器人会变成一个智能、创造力都比肩大学教授的机器化学家。 「我们希望争取到国家的支持,在 2 至 3 年内建成拥有几十台机器人的小型装置,3 至 5 年后建成一个大科学装置。在这期间,我们还需要不断训练机器人和智能化学通用模型。」江俊教授规划着未来的研究蓝图。他们最终目标是改变传统化学研究范式,解放化学家双手。

    发布时间: 2023-07-11

  • 49. 国际图联发布“图书馆协会与可持续发展目标”调查结果
    程冰
    2023年7月3日,根据国际图联“图书馆协会与可持续发展目标”调查显示,世界各地图书馆协会对《联合国2030年可持续发展议程》(United Nations 2030 Agenda)及可持续发展目标(Sustainable Development Goals,SDGs)的认知度和参与度都很高。其中撒哈拉以南的非洲、拉丁美洲和加勒比以及中东和北非地区的协会表现尤为突出。 国际图联图书馆协会管理组(Management of Library Associations Section)目前正在组织“可持续发展目标与图书馆协会”(Sustainable Development Goals and Library Associations)的系列网络研讨会,本次调查是该系列研讨会的补充。它概述了世界各地图书馆协会将可持续发展目标纳入未来规划和资源配置中的程度。 图书馆协会不仅在支持图书馆和图书馆员工作方面发挥关键作用,在宣传倡导方面也有重要影响。协会的参与意味着图书馆距离可持续发展目标的实现更近了一步。 本次调查凸显了在“提高可持续发展目标意识”方面取得的成果,超过85%的协会在“非常了解可持续发展目标”下选择了“同意”或“强烈同意”。超过70%的协会积极参与提高成员图书馆的可持续发展意识。 然而,意识只是第一步,只有当可持续发展的理念融入到思维模式和行为模式中时,真正的影响才会到来。基于此,本次调查得到的数据才值得庆祝,因为大约55%的受访协会“同意”或“强烈同意”《2030年议程》有助于其工作规划的制定。 44%的受访协会表示设有专人或专门委员会,负责围绕可持续发展目标开展工作,从而使协会更容易发现机会并与其他机构合作。 另外,调查显示,可持续发展目标也成为了图书馆协会宣传工作的一部分,超过一半的受访协会表示正在推广可持续发展目标并从中获得支持。然而,参与自愿国家审查进程或各国内部正式可持续发展目标部门的图书馆数量仍然较少。 调查数据按地区进行了分类,从中可以看出,撒哈拉以南非洲、拉丁美洲和加勒比以及中东和北非地区的大多数协会在致力于实现可持续发展目标方面表现最积极,欧洲紧随其后。 除了动员图书馆协会积极参与可持续发展目标进程以外,调查结果也给出一些实用的建议。比如,在如何将可持续发展目标纳入规划和宣传方面,有很多积极的经验可以分享,也有潜力提高图书馆在国家内部可持续发展目标活动的参与度。

    发布时间: 2023-07-11

  • 50. 我国图书情报领域新兴交叉学科发展探析
    黄雨馨
    我国图书情报领域新兴交叉学科发展探析 马费成,张帅 新兴交叉学科正在成为我国科技创新的重要驱动力,并不断催生新的学科生长点和新的科学前沿。本文以当代我国图书情报学科研究中的新兴交叉学科为对象,运用案例分析与比较分析方法,解析我国图书情报领域新兴交叉学科的发展特点与演进模式,探讨我国图书情报领域新兴交叉学科的理论建构。我国图书情报领域新兴交叉学科的发展依赖于“创新驱动、应用引领、技术赋能”,形成了从“问题域—方法论式单向引进”到“方法论—问题域式反向输出”再到“问题域—问题域式双向合作”的演进模式。以此为基础,建构了理论发展与范式革新并重的新兴交叉学科理论模型,为当代我国图书情报领域的新兴交叉学科体系建设提供有益借鉴,为新时代中国特色图书情报学科的创新发展提供有益参考。

    发布时间: 2023-10-10

  • 51. 数智时代的人工智能素养:内涵、框架与实施路径
    饶海侠
    在数字化和智能化以及人工智能(AI)快速发展的背景下,技术的进步不仅改变了我们的日常生活和工作方式,也对教育领域,特别是高等教育中的素养教育提出了新的挑战和要求。2024年2月20日,蔡迎春等在《中国图书馆学报》期刊上发表《数智时代的人工智能素养:内涵、框架与实施路径》一文。文章梳理了AI素养的内涵、框架和实施路径,提出高校图书馆应积极参与AI素养教育。通过引入KSAVE模型,构建涵盖知识、技能、态度、伦理、价值观五个领域的AI素养框架,并建议高校图书馆从跨学科知识体系构建、能力构建与实践应用、道德觉醒与责任担当三个方面开展AI素养教育,培养具有批判性思维和责任感的AI素养人才。 研究内容 文章聚焦于人工智能(AI)素养的内涵、框架以及实施路径。 1.文章探讨了AI素养的概念,认为它不仅是对AI技术的理解和应用,更是一种全面的、与时俱进的技能和知识体系,强调了AI素养在数字化和智能化背景下的重要性。接着,文章通过引入KSAVE模型,构建了AI素养的框架,该框架包括知识(Knowledge)、技能(Skill)、态度(Attitude)、伦理(Ethics)和价值观(Values)五个关键领域,这一框架为全面理解AI素养提供了理论基础。 2.文章重点分析了高校图书馆在AI素养教育中的角色和实施路径。作为长期从事素养教育的核心机构,高校图书馆被赋予了推动时代素养发展的重要使命。文章提出了高校图书馆应从跨学科知识体系构建、能力构建与实践应用、道德觉醒与责任担当三个方面开展AI素养教育,以培养适应数智时代的新型人才。 3.总结部分叙述了AI素养教育的挑战和前景,强调了高校图书馆在推动AI素养教育中的关键作用,并对未来的发展趋势进行了展望。 研究结论 1.指出人工智能素养不仅包括对AI技术的理解和应用能力,还涉及到伦理观念、价值取向以及社会责任感等多维度内容,这一结论强调了人工智能素养教育的全面性和深度,不仅要求个体掌握技术知识,还要注重伦理、价值和社会参与的培养。 2.提出了一个全面的人工智能素养框架,该框架包括知识维度、技能维度和态度、价值观和伦理维度,这一框架为人工智能素养教育提供了指导和参考,帮助教育者明确教育目标和内容,同时也为学习者提供了一个清晰的学习路径。 3.文章最后强调了高校图书馆在人工智能素养教育中的关键作用。作为知识的宝库和传播枢纽,图书馆不仅提供与AI相关的资源,还承担着推动跨学科知识整合和培养创新思维的重要任务。文章提出图书馆需要积极应对AI技术与多学科知识的融合,设计创新教育课程,并引导学生适应AI技术带来的社会变革。

    发布时间: 2024-10-31

  • 52. 国际图联战略:2024-2029
    程冰
    10月1日,国际图联发布文件公布其2024-2029 年战略。该战略规划聚焦于三个主要领域,以实现图书馆在全球范围内的互联、赋能和认可: 1、图书馆通过全球专业社区实现连接并保持活力 2、图书馆作为合作伙伴得到认可、代表和重视 3、使图书馆能够在各个层面进行有意义的变革 由于国际图联的独特地位,可以保障其发挥该战略中规定的作用。为了在国际图联的第二个一百年做到这一点,国际图联需要继续关注如何最有效地履行自己的使命。通过这种方式,可以实现一个良性循环,吸引活跃的会员、专家志愿者和优秀的合作伙伴,反过来使国际图联能够更好地通过图书馆实现进步。

    发布时间: 2024-10-31

  • 53. 澳门大学图书馆馆长、中国图书馆学会学术研究委员会名誉主任吴建中
    闫亚飞
    澳门大学图书馆馆长、中国图书馆学会学术研究委员会名誉主任吴建中带来了首场报告《元宇宙,让图书馆更智慧》,他对元宇宙与图书馆之间的关系及其对事业发展的影响进行了深入探讨,如何融入元宇宙技术有力推进智慧图书馆建设指明了未来发展方向。图书馆需要元宇宙,元宇宙技术对现有交流方式的丰富、拓展和创新,让图书馆在现有困境下重新实现了信息(书)流通和人际交流的功能。元宇宙技术能为图书馆带来多种好处,展示珍贵资源,深化数字人文研究机会,创新知识发现和参考咨询,提升图书馆的包容性服务,吸引更多年轻人利用图书馆。元宇宙技术也会为图书馆带来的新课题,需要图书馆人跟进虚实融合的混合方式等技术潮流,主动参与元宇宙生态系统,适应并拥抱的图书馆的变革。

    发布时间: 2023-07-11

  • 54. 合成数据加速用于 X 射线图像分析的基于ML的可推广算法开发
    闫亚飞
    近日,约翰斯·霍普金斯大学(Johns Hopkins University)的研究人与证明了从人体模型创建逼真的模拟图像是一种可行的替代方案,是对大规模原位数据收集的补充。在真实合成数据上训练 AI 图像分析模型,结合当代领域泛化技术,可以生成在真实数据上训练的机器学习模型,其性能与在精确匹配的真实数据训练集上训练的模型相当。 研究人员展示了被称为 SyntheX 的 X 射线图像分析模型传输范例,由于在更大的数据集上训练的有效性,甚至可以胜过真实数据训练的模型。SyntheX 提供了一个显著加速基于 X 射线的智能系统的概念、设计和评估的机会。 此外,SyntheX 提供了测试新仪器、设计互补手术方法和设想新技术的机会,这些技术可以改善结果、节省时间或减少人为错误,而无需考虑实时人类数据收集的伦理和实践考虑。 到目前为止,还没有研究使用跨领域精确匹配的数据集来隔离领域泛化的影响。这项工作还展示了一种可行且具有成本效益的方法来训练 AI 图像分析模型以对合成数据进行临床干预,其性能可与多种应用中的真实临床数据训练相媲美。另外,模型的性能随着合成训练样本数量的增加而大幅提高,这突出了 SyntheX 的关键优势:为模型训练或预训练提供大量注释良好的数据。 使用合成数据训练机器学习算法正受到越来越多的关注。在一般计算机视觉中,Sim2Real 问题已针对自动驾驶感知和机器人操作进行了广泛探索。在诊断医学图像分析中,基于 GAN 的新样本合成已被用于增强磁共振成像、超声、视网膜、皮肤病变和 CXR 图像的可用训练数据。在计算机辅助干预中,Sim2Real 问题的早期成功包括对内窥镜图像和术中 X 射线的分析。这里的对照研究表明 Sim2Real 优于 Real2Real 训练,从而在 X 射线领域验证了这种方法。

    发布时间: 2023-07-11

  • 55. AI驱动的科研范式变革:跨学科视角下人工智能素养与教育培养策略研究
    程冰
    作者在《世界科技研究与发展》发表文章,构建了一个面向智能化科研(AI for Research, 简称AI4R)的人工智能(Artificial Intelligence,简称AI)素养教育培训体系,对培养出更多既具备技术知识,又拥有创新思维和伦理意识的科学研究者具有非常重要的作用。通过对全球主要国家与AI相关的素养教育政策、课程与培训项目进行对比分析的基础上,认为这个体系框架不仅关注教育对象对AI的知识理解,注重实践能力的培养以及伦理和社会责任的教育等,还需要关注跨学科思维及情感联系的教育。面对高校教师和学生两个层面的受教对象,AI素养的教育培养策略起着至关重要的作用。这些教育培养策略可由政府、教育机构、企业等社会性机构,亦或是图书馆、社区等公益性组织实施,他们通过承担特定的角色和职责,共同构成了一个多层次、互补的教育培养策略,不仅推动AI技术在科学领域的应用,还负责培养新一代的科研人员,使其具备利用AI技术进行跨学科研究的能力。

    发布时间: 2024-10-31

  • 56. 场景化智慧数据驱动的情报研究模式:概念、技术框架和实验验证
    闫亚飞
    情报研究是科技文献机构满足科技决策和服务需求、提供知识化服务的重要手段。随着科技决策和服务需求的深入,以及数据信息资源和技术的发展,情报研究先后经历了以文献、信息报道和资料翻译汇编为主的“文献搜集与资料整理服务”、以深入文献文本统计为主的“计量研究和检索服务”、以针对明确问题的基于大量资料的调研报告为主的“情报专题服务”、基于信息和技术的面向科技创新问题的“知识提供”等(如面向规划与布局的科技领域态势研判和机制体制分析等)发展阶段。不同历史阶段的情报研究具有其需求的合理性和历史的必然性,体现了不同时期的知识服务内涵与特点,这些情报研究类型至今在特定需求下仍在发挥重要作用。 按照科研决策机构的要求,“情报服务要实现从数据到情报到知识到智慧的服务”和“智慧体现在可能的解决方案——Possible Solutions”。当前,国际科技竞争态势错综复杂,学科交叉融合、科研范式变革推动科技领域不断催生重大创新,ChatGPT等信息技术严重冲击传统知识服务,科技决策需要综合研判的因素更加多元,对数据和信息的需求更高。因此,情报研究在提供可能解决方案的知识服务中面临严峻的挑战:如何把握和解析“科技决策需求”本身?如何构建可循证的“数据+情报+知识”链与“科技决策需求”对齐?如何为“科技决策需求”“生成”“可能的解决方案”? 文章针对当前“科技决策需求”的特点,提出场景化智慧数据驱动情报研究模式,建立科技决策需求场景(S)-场景化数据(DX)-解决方案场景(S)的量化表征模型(SDS),场景化分析视角贯穿SDS模型实现路径全链条。研究初步解决了“科技决策需求”本身的结构化可计算的描述(场景化),对齐“科技决策需求”结构化可计算的场景化数据(智慧数据)的挖掘与组织,以及在此基础上的可选解决方案的“生成”方法,并通过实例进行初步验证。

    发布时间: 2023-07-11

  • 57. 培养人工智能时代负责任和有创造力的公民——联合国教科文组织《学生人工智能能力框架》报告要点与思考
    程冰
    随着人工智能技术在教育教学中的广泛应用,将人工智能学习目标纳入学校正式课程,培养学生人工智能能力,对于学生安全、符合伦理地使用人工智能至关重要。联合国教科文组织制定的《学生人工智能能力框架》,定义了学生在人工智能时代必须掌握的知识、技能和价值观。该框架以增强人类能动性、遵循以人为本、促进可持续发展、确保包容性和促进终身学习为原则,采用二维矩阵的方法,构建了涵盖以人为本的思维方式、人工智能伦理、人工智能技术与应用以及人工智能系统设计 4 个能力维度,横跨理解、应用和创造 3 个能力等级的 12 个人工智能能力模块。 一、问题提出 人工智能不仅直观地展示出其洞见未来的诸多可能,而且推动着教育新范式的形成、新文化的构建和新型学习型人才培养模式的诞生。联合国教科文组织 2024 年发布的《学生人工智能能力框架》(以下简称《框架》),界定了学生应具备的人工智能知识、技能和价值观,帮助学生了解人工智能在教育中的作用。 二、制定原则 (一)培养对人工智能的批判性思维方法 (二)优先考虑以人为本的人工智能互动 (三)鼓励环境可持续发展的人工智能 (四)促进人工智能能力发展的包容性 (五)培养终身学习的核心人工智能能力 三、内容框架 (一)二维内容结构 (二)四个能力层面 1. 以人为本的人工智能思维方式 2. 人工智能伦理 3. 人工智能技术和应用 4. 人工智能系统设计 (三)三个能力等级 1. 理解等级 2. 应用等级 3. 创造等级 四、应用对策 (一)评估国家人工智能战略制定情况 (二)开发跨学科的核心人工智能课程 (三)设计面向未来的本地人工智能课程 (四)定制适合年龄的螺旋式课程序列 (五)构建支持人工智能课程的学习环境 (六)支持人工智能教师的终身专业发展 (七)设计基于群组的教学活动和项目 (八)制定基于能力的人工智能评估标准 五、简要思考 (一)研制以人为本的国家人工智能战略,创建支持人工智能教育的数字化环境 (二)构建新型的人工智能教师培养体系,筑牢高水平的人工智能人才队伍基座 (三)重视人工智能工具与学科深度互融,形成人机协同的智能素养教育新生态 (四)研发符合伦理原则的能力评估工具,动态评估和提升师生的人工智能能力

    发布时间: 2024-10-31

  • 58. 国际动态 | 2024年国际图联绿色图书馆奖终选名单揭晓,佛山市图书馆入围
    程冰
    2024年5月13日,国际图联环境可持续性与图书馆组(ENSULIB)公布了第九届国际图联绿色图书馆奖(IFLA Green Library Award)8份入围终选名单的申请。ENSULIB共收到了来自世界各地的44份申请,其中23份入围初选名单。 2024年国际图联绿色图书馆奖分为“最佳绿色图书馆”(Green Library)和“最佳绿色图书馆项目”(Green Library Project)两种类别。 “最佳绿色图书馆”入围名单(按国家名字母顺序排列)如下: ·德国 帕德博恩 帕德博恩市图书馆(Stadtbibliothek Paderborn):“Eden——可持续发展的图书馆”(Eden – a sustainable library) ·西班牙 萨拉曼卡 萨拉曼卡大学生物学图书馆(Biology Library of the University of Salamanca):“虽然小,但齐心协力就能成功!”(Small, but working together it works!) ·美国 米苏拉 米苏拉公共图书馆(Missoula Public Library):“米苏拉公共图书馆”(Missoula Public Library) “最佳绿色图书馆项目”入围名单(按国家名字母顺序排列)如下: ·中国 佛山 佛山市图书馆(Foshan Library):“绿色阅读:智能书库项目”(Reading in Green: the intelligent book stacks project) ·爱尔兰 都柏林 都柏林大学图书馆(UCD Library) 詹姆斯·乔伊斯大楼(James Joyce Building):“超越生命周期:图书馆支持循环经济”(Beyond the Lifecycle: Libraries Supporting the Circular Economy) ·斯洛文尼亚 新戈里察 新戈里察France Bevk公共图书馆(France Bevk Public Library Nova Gorica):“Guardians of Seeds:保护我们的遗产”(Guardians of Seeds: Preserving Our Heritage) ·土耳其 安卡拉 U?ak Banaz公共图书馆(U?ak Banaz Public Library):“Agro图书馆:从消费型社会到生产型社会”(Agro Library: From a Consuming Society to a Producing Society) ·乌克兰 基辅 普里奥卡儿童图书馆(Library at Priorka for children):“绿色图书馆生态空间:寻找生态英雄,走出生态危机”(Ecological space “Green Library”: in search of ecoheroes and a way out of the ecological crisis) 2024年国际图联绿色图书馆奖最终获奖机构和项目将于2024年10月公布。

    发布时间: 2024-07-26

  • 59. 首个单细胞生物学基础大型语言模型,在超1000万个细胞上进行预训练
    闫亚飞
    近日,来自加拿大多伦多大学和彼得·蒙克心脏中心(Peter Munk Cardiac Centre)的研究人员,通过利用呈指数增长的单细胞测序数据,首次尝试对超过 1000 万个细胞进行生成预训练来构建单细胞基础模型。 这是第一个基于单细胞生物学的大型语言模型。 研究人员证明了生成式预训练 Transformer scGPT 可以有效地捕获对基因和细胞有意义的生物学见解。此外,该模型可以很容易地进行微调,以在各种下游任务中实现最先进的性能,包括 multi-batch 整合、多组学整合、细胞类型注释、遗传扰动预测和基因网络推断。 生成式预训练模型最近在许多领域取得了前所未有的成功。 但目前单细胞研究中基于机器学习的发现相当分散,特定模型专用于特定分析任务。由于测序能力和研究问题的范围,每项研究中使用的数据集的广度和规模通常也有限。这需要在大规模数据上进行预训练的基础模型,以实现对单细胞生物学的一般理解。 虽然单细胞生物学中生成预训练的可行性在很大程度上仍未得到探索,但可以从其他领域汲取关于建模和以数据为中心的观点的灵感。 在此,研究人员首次尝试通过对超过 1000 万个细胞进行生成预训练来构建单细胞基础模型 scGPT。研究证明预训练模型在基因和细胞水平上捕获了有意义的生物学见解。通过在少量学习设置中进行微调,该模型在广泛的下游任务上实现了最先进的性能。 scGPT  首先对来自细胞图谱的大规模 scRNA-seq 数据进行生成训练。对于下游应用,可以根据新数据微调预训练模型权重。scGPT 的核心组件包含带有用于生成训练的专门注意掩码的堆叠 Transformer 块。将 scGPT 应用于各种任务,包括多组学整合、batch 校正、细胞类型注释、遗传扰动预测和基因网络推理。输入包含三层信息:基因标记、表达值和条件标记。

    发布时间: 2023-07-11

  • 60. 图书情报学研究方法和理论的跨学科使用意愿联动效应研究
    黄雨馨
    图书情报学研究方法和理论的跨学科使用意愿联动效应研究 杨志刚 / 郑禧潓 / 刘竟 / 卢章平 / 苏文成 图书情报工作.2023 Vol.67 (15): 94-104. 摘要: [目的/意义] 在学科交叉合作蓬勃发展的时代背景下,探究图书情报学研究方法和理论跨学科使用意愿影响因素的组态路径,为图书情报学的跨学科研究和学科影响力提升提供更广泛、深刻的思路,对促进学科交叉合作,解决科研迫切需求和社会重大实际问题等具有一定的理论与现实意义。[方法/过程] 以图书情报学研究方法和理论的跨学科使用意愿为主题,以认知-情感-意动为理论基础,构建图书情报学方法理论跨学科使用意愿模型,采用模糊集定性比较分析法得出影响因素的组态路径构成,并探求其组成机理。[结果/结论] 研究表明图书情报学科研究方法和理论的跨学科使用意愿是多因共致的结果,使用fsQCA研究方法得出了三条组态路径并概括为:学科知识——创新协同型组态、学科知识——社群协同型组态、学科知识——交叉基础驱动型组态。基于对组态路径联动作用机理的深入研究与解析,对学科未来发展提出如下建议:以现实为导向,加强学科建设,推进学科知识体系转型升级;立足“信息资源管理”守正创新,提升学科吸引力;积极推动跨学科合作,增强学科影响力;发挥信息交流支持作用,强化学科社群感知力。

    发布时间: 2023-10-10

  • 61. 《全民数字素养与技能发展水平调查报告(2024)》发布
    程冰
    中央网信办会同中国科协等开展了首次全国范围的全民数字素养与技能发展水平调查,以数字认知、数字技能和数字思维为主要能力测度方向,结合受访者数字活动参与行为考察,编制形成报告《全民数字素养与技能发展水平调查报告(2024)》,并于10月25日发布。我国六成以上公民具备初级及以上数字素养与技能。我国60.61%的成年人和64.69%的未成年人具备初级及以上数字素养与技能,16.26%的成年人和12.55%的未成年人具备高级数字素养与技能。   数字素养与技能水平和区域经济发展态势相符。东部地区、中部地区、西部地区成年人具备初级及以上数字素养与技能水平占比(以下简称“初级及以上水平占比”)分别为63.23%、60.03%、56.90%,具备高级数字素养与技能水平占比(以下简称“高级水平占比”)分别为18.50%、15.13%、13.80%;其未成年人初级及以上水平占比分别为71.60%、63.70%、59.25%,高级水平占比分别为17.56%、10.06%、9.40%。   城乡居民数字素养与技能水平协同提升。城镇成年人初级及以上水平占比为65.92%,高级水平占比为19.83%;城镇未成年人初级及以上水平占比为70.94%,高级水平占比为15.90%。农村成年人初级及以上水平占比为50.57%,高级水平占比为9.53%;农村未成年人初级及以上水平占比为53.11%,高级水平占比为6.33%。  各年龄段人群数字素养与技能发展态势持续向好。12-14岁、15-17岁年龄段人群初级及以上水平占比分别为61.20%、68.67%,高级水平占比分别为10.94%、14.38%。18-29岁、30-39岁、40-49岁、50-59岁、60-69岁年龄段人群初级及以上水平占比分别为75.76%、69.90%、61.70%、53.16%、36.22%,高级水平占比分别为28.69%、19.67%、13.83%、10.12%、7.34%。   受教育程度是影响数字素养与技能的关键因素。小学及以下、初中、高中、大学专科、大学本科及以上受教育程度成年人的初级及以上水平占比分别为35.37%、54.79%、71.13%、82.73%、91.40%,高级水平占比分别为5.43%、7.62%、18.21%、30.51%、53.49%;其未成年人初级及以上水平占比分别为45.96%、64.65%、71.74%、77.38%、84.22%,高级水平占比分别为5.74%、12.06%、15.67%、16.83%、33.70%。  我国劳动者适应数字时代职业发展需要的能力逐步增强。全国就业人员的初级及以上水平占比为67.85%、高级水平占比为19.75%。其中,“办事人员和有关人员”“专业技术人员”“党的机关、国家机关、群众团体和社会组织、企事业单位负责人”“生产制造及有关人员”“社会生产服务和生活服务人员”“农、林、牧、渔业生产及辅助人员”的初级及以上水平占比分别为79.06%、76.22%、72.49%、67.82%、62.59%、59.73%,高级水平占比分别为33.77%、29.12%、26.02%、15.34%、12.71%、11.55%。

    发布时间: 2024-10-31

  • 62. ACRL发布《2023环境扫描》
    闫亚飞
    一、新冠疫情的持久影响 虽然新冠疫情正处于从大流行到地方性流行转换期,但疫情导致的图书馆服务、馆舍空间和人员配备方面的变化仍在继续。与其他社会领域一样,高等教育机构及其图书馆也正在适应理念和实践上的转变,这一转变将比疫情本身更持久。 1 馆舍设施 2021年底,随着疫情防控措施放宽,用户和馆员得以重返图书馆,并对疫情前的日常工作和面对面服务流程进行了重新审核和调整。线上提供服务和获取信息已成为图书馆内部管理和用户服务的主流方式。疫情催生了一些影响图书馆物理空间的重要议题。最重要的是,疫情加剧了图书馆线下和线上服务之间的耦合和分化,也使得资源充足和不足的图书馆之间的差异更加明显。一项研究选取了三所美国高校,分别比较各高校在2019和2020年特定时间段内的图书馆数字服务使用量,结果发现:与其说疫情期间的使用量增长了,倒不如说是由于线下服务受限导致用户不得不使用线上服务。此外,图书馆正在使用更强大的内部交流工具和平台,员工管理和交流方式因而发生了明显变化。然而,为应对疫情所采取的改变恰恰也给馆员和用户造成了压力。从长远看,疫情引发了关于如何为未来流行病的爆发和服务中断做好准备,以及如何将更新后的流程整合进图书馆总体工作流程的讨论。未来十年,图书馆空间规划和使用的核心问题是现有物理空间如何更好满足不断变化的用户需求和服务模式。一些趋势似乎正在影响关于上述问题的讨论。首先,数字服务和数据库的更深层次整合将不断改变图书馆对集中式、面对面工作环境的依赖,因为更多的服务将永久转移到线上或者在集中化场所之外的地点开展。与商业办公场所类似,图书馆需要更严格地评估空间利用情况,为这些需求决定“合适的空间大小”,并尝试更多不同的空间布局,以满足多种声学、隐私和技术需求。促使图书馆调整空间布局的原因之一是让最终用户自行调整空间布局,无论是开辟一个安静的区域来保证“视听隐私”,还是使用可移动白板开展即兴小组学习。利用设计技巧可以满足这些需求,比如更多地安装可拆卸隔断而非永久性内墙,以及在公共空间广泛布设电源和信息技术基础设施。其次,图书馆将继续从空间韧性的角度审视服务。在加强在线服务能力的同时,还要改造空间,保证即使在用户和馆员数量大幅缩减的情况下,也能提供现场的核心服务。处于基础建设规划或设计阶段的项目不仅要考虑如何应对潜在的突发卫生事件,还要考虑日渐极端的气候、水资源短缺和其他潜在灾害。高校图书馆要提升数字图书馆的灾备管理水平,包括馆员培训、应急预案制定和灾备设施配备,提供线上线下一体化的服务体验。对空间使用和分配的审查变得更加严格,这迫使建筑设计方、馆员、管理部门和用户思考哪些空间是必要的,并寻找改造空间用作其他用途的方法。例如在密苏里大学,学校管理部门希望在2024年前通过拆除或撤资将其常规建筑空间减少20%,促使采取这一措施的主要动因是降低长期运维成本以及提高校园设施的整体运行效率。该校的效率评估因此从三年一次增加到一年一次,并且部分运维成本被转移到像图书馆这样的学术和支持机构。随着数字化驱动转型的持续,图书馆也对实体和数字馆藏规模进行更频繁的评估,这导致对于文献采选和费用支出的决定变得越来越困难。由于数字资源使用和长期维护成本不断上升,一些图书馆选择以馆际互借等方式为用户提供资源,以减少在馆藏空间和采购资金上的投入。而在线下的馆舍,则举行更多专题活动,提供专门的馆藏和服务,图书馆还与学校相关部门合作提供各种校园服务。一位建筑师表示上述做法并非什么新鲜事,他认为近期人们对于这些做法越发热衷的理由可能部分归于“图书馆‘不需要有书’的观点,另一方面,图书馆也希望以此增加访问量和机构活跃度,确保未来得以生存。”步入2023年,处于规划、设计和建设阶段的图书馆项目持续受高通胀水平影响,使得对于空间利用和基础建设规划合作的关注度日益提升。美国总承包商协会(Associated General Contractors of American,AGC)的数据显示,建筑材料行业的通胀水平似乎在持续上升,预计到2024年也不会恢复到历史正常水平。根据AGC的说法,这一增长不仅受原料价格上涨的影响,还与劳动力日益短缺有关,尤其是对于特定的承包商而言。应对以上趋势和关切,还需要进一步思考许多问题:图书馆的哪些资源、服务只能集中在馆内并当面提供?哪些资源可以完全转移到线上或者分布到整个校园?对数字资源和服务的日益依赖暴露了不同用户之间的哪些技术和数字鸿沟?高通胀时代,高校应如何平衡对于物理空间和数字资源的需求? 2 人员配备 高校图书馆的人员配置情况在不断变化。疫情、预算限制、工作生活平衡的理念、远程和混合办公的机会(也可能缺乏)、令人消极的工作环境和工作满意度等问题影响着在图书馆工作或考虑在图书馆工作的求职者。虽然一些问题对业内并非新鲜事,但领导、管理者和馆员对此的反应正发生变化。受到讨论最多的现象之一是馆员因加班和工作所需的资源不足而产生的职业倦怠。Anthony Klots发明了“大辞职潮”(Great Resignation)一词,用于描述疫情以来美国数百万人辞职的现象,这也是很多图书馆面对的现实。一些馆员离开了,其余留下来的人不得不承担更多工作, 由此导致了“ 在职躺平”(quietquitting),这是另一个在图书馆博客和社交媒体中流行起来的职业行话。与辞职不同,“在职躺平”指的是不做职责之外的事和/或减少心理上对工作的投入。在职躺平者在完成基本工作之外,对于需要加班、早到以及非强制性会议的参与意愿更低。在寻求填补职位空缺的同时,许多图书馆利用这一机会对岗位和职位进行了重新定义。有研究者指出当前的五个新兴岗位包括:可持续发展馆员、用户体验馆员、“公平、多元和包容性”主管、开放教育资源馆员和数据可视化馆员。这些新岗位的诞生既体现了图书馆对于学生需求的越发重视,也表明他们意识到了组织文化和社会文化的转变。弹性工作制成为许多高校图书馆的核心议题,现场、远程和混合办公模式成为管理者经常讨论的话题,也是员工的诉求。这种工作制引发了人们对其在员工工作满意度、招聘和留任、绩效表现、员工参与度、工作可见度和图书馆空间使用的影响的疑问,上述这些方面的研究仍在进行中。同时,弹性工作制也凸显了办公条件的不平等,员工可能因其工作职责以及在家使用电脑和上网的方便程度的不同,其享受弹性工作安排的条件也不一样。馆员在思考未来发展和权衡职业的利弊时,会比较薪水、福利、工作安排的灵活性、晋升机会、工作环境和组织文化等因素。而当馆员犹豫是否要留在图书馆时,领导者和管理者就面临着挑战,如何确保图书馆的组织文化能反映使命、价值观和优先事项,并评估弹性工作制对组织文化的影响。诚然,雇主可以为员工提供远程工作所需的设备,但如果无法吸引员工,传递价值观并认可员工所做的贡献,员工就不会为机构的长期成功付出精力。 启示? 鉴于图书馆提供的面对面服务的减少以及数字服务的增加,用户对于灵活空间的需求以及更多馆员采用远程+混合工作模式,高校图书馆需要评估其空间需求,并考虑调整空间的用途。? 图书馆工作人员在寻找工作机会时,乐意接受灵活工作安排、工作与生活平衡等理念。图书馆管理者需要关注组织文化,使其与图书馆和员工的价值观保持一致,提高包容性和归属感,解决工作负荷和士气问题,并提供成长和晋升的机会从而吸引和留住员工。 二. 学术交流 1 开放数据和最大化共享数据 与其他领域一样,学术交流的模式也因疫情引起的价值观转变和人们对于远程办公的关注发生了变化。虽然转变的速度之快前所未有,但学者和学术成果传播方都已经在努力应对,并在一定程度上适应了新的混合会议模式、数据共享的新尝试和大学的财务压力。或由于疫情原因,同行评审速度变慢,预印本服务器(主要存放未经同行评议或尚未正式出版的学术论文)可能会继续增多。为最大限度地实现数据共享,美国国家卫生研究所(National Institutes of Health, NIH)要求资助者在申请时必须提交“数据管理和共享计划”。疫情期间与新冠肺炎相关研究数据的广泛共享在疫苗研发中发挥了至关重要的作用,突出了类似“数据管理和共享”政策的价值以及科研合作的重要性。以前,NIH只要求年度花费50万美元及以上的项目公开研究数据。这项新政策将适用更多项目,从而扩大数据的公开范围,还将为研究人员在临床研究数据管理等方面提供支持。随着越来越多的出版商或为论文制定了数据共享指南,或要求提供论文的数据可用性声明,读者可以更容易地获取未包括在补充材料中的研究数据。白宫科技政策办公室(Office of Science and Technology,OSTP)为了最大限度地扩大公众对出版物和研究数据的访问,针对资助研发项目的联邦机构发布了类似的指南,其于2022年8月发布Nelson备忘录,特别建议所有联邦机构更新公开访问政策,以确保:1)提供科研产出的出版物及其支撑数据无时滞期的免费开放获取;2)建立透明的程序,使公众能够访问完整的研究信息;3)与OSTP“联邦资助的研究成果和数据公平获取”的要求相协调。更大的数据公开度、更周全和可持续的数据管理看似对学术交流产生了积极作用,但研究人员也列举了新政实施过程中遇到的问题,包括存储库基础设施不充足,与数据所有权和使用的先入为主的成见作斗争,以及实施申请的时间过长。不久的将来,当研究人员在制定数据管理计划,创建和保存数据遇到问题时,一定会寻求高校图书馆员的帮助和支持,他们应该为此做好准备。 2 新角色和新工具 学者在研究初始阶段除了需要馆员协助查找和筛选一手资料,还需要馆员提供更多的支持。有研究人员发现支持科研人员的工作流程是高校里最迫切的需求,还有学者指出,馆员要更频繁地在研究项目的整个生命周期中提供技能和服务支持,包括数据准备、清洗和保存。技术工具的不断进步在给馆员带来了新责任的同时,也为开放获取出版和机构库优化提供了新机遇。馆员在疫情后出版潮中所发挥的作用扩展到了学术圈以外,例如华盛顿大学与其图书馆的学术传播部、学科联络人和研究共享中心合作举办公共学术活动,以此弥合学术界与公众之间的差距。虽然数字技术为馆员和学术交流提供了新的机会和经验,但在此类工具的管理维护方面存在问题。研究发现,不同的学术内容提供商对数字对象标识符(Digital Object Identifier, DOI)的响应结果不一致。DOI日益成为在线学术引用的标准标识符,因此需要对这一问题和DOI管理进行更多研究,以保证其使用的可持续性和一致性。 启示? 为了满足日益增长的数据共享需求,馆员在创建和整合工作支持流程,开发数据管理工具,完善技术基础设施,通过举办社会活动促成不同学术团体之间的合作从而推动研究发展方面存在巨大机遇。? 图书馆在学术交流领域能否发挥作用取决于能否解决实际问题,包括:开发和维护资源库架构,支持研究数据的长期保存和永久访问,以及精简研究人员的数据管理工作流程。 三. 图书馆馆藏 馆藏开发和管理模式快速变化。疫情期间,高校图书馆的空间和服务数字化转型加速,馆藏的多样性、公平性和包容性受到更多关注,对于受控数字借阅模式的兴趣和尝试增多,纸质资源共享项目不断发展。图书馆在寻求机会和应对挑战的同时,需要在“空间、预算和版权许可所允许的范围内,切实处理好馆藏获取、所有权和保存等与图书馆核心价值相关的问题”。 1 向电子书和数字馆藏加速转型疫情之下,许多高校图书馆为了支持远程学习,将馆藏战略重点转移到电子书和数字馆藏。疫情之前,图书馆已经逐步提高了电子书的采购比例,疫情加剧了这一趋势。相关统计显示,电子书采购量占总量的比例已从2020财年的54%提升为2021财年的69%。更多的图书馆批准了“数字优先”的采购政策,并且越来越多地使用循证采购(Evidence-based Acquisition,EBA)和需求驱动采购(Demand-drive Acquisition,DDA)模式。上述趋势预计将持续下去。在一项针对美国402所高校图书馆馆员的调查中,绝大多数人预计电子资源的采购量将继续增加,而特藏的采购量将保持不变,纸质出版物的采购量将继续下降。虽然在图书馆闭馆期间,数字资源优先策略为学生居家学习扩大了资源获取途径,但某些馆员和研究人员并不认可采取这种采购策略,并表达了担忧。拉丁美洲图书馆资料采购研讨会(Acquisition of Latin American Library Materials ,SALALM)发布了一项决议,指出“数字优先”政策对建设国际化馆藏的影响,并敦促图书馆继续购买纸质图书,以保证馆藏资源的区域多样性。与地区研究有关的其他组织公开赞同了SALAM声明或起草了类似声明。也有研究者认为EBA和DDA模式可能对馆藏多样性产生负面影响。随着数字化转型的加速,除了衡量资源内容质量和关联度以外,负责馆藏开发和授权许可工作的馆员需要评估许多其他因素,包括MARC记录和资源使用统计数据的可获得性、购买和使用模式、永久访问使用规定、数据可访问性和保存机制。研究表明,随着图书馆事业的发展和研究方法的变化,数字资源的授权许可需要关注与文本和数据挖掘、自愿产品可访问性模板(VPATs)1 、可获得性、用户数据保密性、资源使用统计标准(包括COUNTER/SHUSHI标准)相关的内容,以及针对预算不足的图书馆的预警性条款。1 为了帮助联邦机构和相关的供应商判断特定产品是否符合508条例(1973年颁布的美国劳工康复法案“RehabilitationAct”的修正条例,规定残疾人有权使用所有联邦政府发展、促成、维持或使用的电子和信息技术),美国信息技术行业协会制定了自愿产品可访问性模板,方便供应商对自己的产品进行预评估,评测是否符合508条例要求。 2 多样性审核高校图书馆已经认识到在馆藏中更好的吸纳和突出BIPOC(黑人、土著和有色人种)和LGBTQIA2S+群体相关内容的重要性。馆员已开始从多样性、公平性、包容性和可获得性角度,进一步讨论如何评估馆藏质量和改进馆藏采访策略,其中一项新策略是多样性审核。虽然图书馆馆藏多样性审核在公共和学校图书馆由来已久,但对于高校图书馆却是新现象。高校图书馆可以使用多种方法进行多样性审核:参照多元化文学奖项获奖情况,将本馆馆藏与业内其他机构的进行对标;与其他同行机构比较特定主题馆藏的多元化程度;评估馆藏在作者性别、性取向、种族、民族或其他方面的多样性程度。有学者强调,确定上述特征时,切不可主观臆断,而是要根据作者自我介绍或可靠的二手资料来判断。有研究指出,“多样性审核工作并非一劳永逸,代表性不足的群体的相关馆藏评估不应是一次性的,建立和调整馆藏需要开展持续性评估”。对每年新入馆藏进行多样性审核既是一个易于入手的项目,也有益于跟踪图书馆馆藏多样性。有研究建议在对新入馆藏编目时记录这些多样性数据,从而提高每年的数据采集效率。 3 受控数字借阅(Controlled Digital Lending,CDL)根据相关白皮书所述,CDL服务模式允许图书馆在尊重版权的同时,利用合理使用和首次销售权利用尽原则将图书的数字复本借给用户。CDL要求图书馆遵循以下四个原则控制图书的出借:必须限制“库存与出借”的比例;纸质书被储存起来,不会流通;利用资源管理系统限制外借时间;使用技术手段,确保数字版权管理协议实施到位。疫情期间,为满足研究人员和学生的需求,许多图书馆通过HathiTrust的“紧急临时访问服务”或本馆预订系统尝试实施了CDL。许多图书馆联盟和工作组都在研究CDL,将其视为一种通过馆际互借提供文献的模式,并开始制定CDL指导方针和指南标准。例如,梅隆基金会已资助美国国家信息标准组织开展CDL项目,从而为其实践和发展提供支持。然而,CDL服务的法律依据尚未在法庭上得到验证。互联网档案馆作为CDL服务的先驱,开发了能够提供纸质书扫描复本借阅的CDL系统,并且是在严格限制和相应指南的指导下实施的。2020年3月,为应对疫情影响,互联网档案馆推出了“国家紧急图书馆”计划,该临时举措取消了“库存与出借”比例限制,为用户提供原本因各图书馆闭馆而无法获得的数百万本图书借阅。这一行为招致出版商联盟提起诉讼,迫使互联网档案馆在2020年6月关闭“国家紧急图书馆”,并恢复实施“一复本一用户”的规定。自此,该案就一直在法院审理中。随着原被告双方共同提出简易判决动议 2,图书作者、法律专家、专业组织和行业协会对该案(阿歇特出版集团诉互联网档案馆)的观点各执其词。该案将对CDL发展前景产生深远影响。出版商似乎质疑的不仅是“国家应急图书馆”项目本身,还有CDL的存在基础。有法律界人士表示,该案将图书馆提供馆藏外借这一传统职能与出版商提供电子书许可的愿望相对立。然而,在CDL的限制条件下,数字借阅对市场的影响仍然小于实体借阅。有学者进一步研究了美国和加拿大支持和反对CDL的论点,最终得出结论“CDL模式的前景可能超过其潜在风险。根据以版权法为基础的道德原则,建议不应过度追求法律规定,以阻碍CDL的实施”。2 motions for summary judgment,是指对于要件事实(material fact)不存在实质争点,且动议人有权将其主张或者抗辩作为法律问题(a matter of law)(由法官进行裁判)而获得的判决。法庭根据诉答文书、动议以及当事人所举出的其他证据,来判断要件事实是存在实质争议还是仅仅存在法律问题争议。这一制度允许快速处理争议而无需经过庭审。 4 异地储存、纸质资源共享和集体馆藏自哈佛大学图书馆于1986年建成高密度储存系统,加州州立大学北岭分校在1992年安装了第一个自动化储存和检索系统开始,图书馆一直在用这种储存方式来应对空间不足的挑战。有些高密度储存设施(即密集书库)供一个机构单独使用,有些则是合作共建。这些书库有时也提供给非合作方图书馆使用,例如德州农工大学和德州大学联合建立的储存库。最初,图书馆通过异地储存低使用率的文献,从而为新购馆藏腾出空间,现在则是为了释放面向学生、用于学习、合作和提供新服务的空间。另一方面,异地储存的馆藏量不断增长,随之出现了对于这些文献的流通需求。正如有人谈到伊利诺伊大学厄巴纳-香槟分校的橡树街图书馆(该校的密集书库所在地)时所指出的那样,“那里收藏的不是永远不离开图书馆的静态馆藏,而是充满活力的流通馆藏”。实现密集书库从储存到服务的功能转变,需要重新调整人员配备模式和工作流程,然而,即使是密集书库也将达到容量极限。由于没有更多资金来扩建,图书馆将面临更多“剔旧馆藏的特殊情况”,同时通过继续开展纸质资源共享项目来提升储存容量。这就要求图书馆在馆藏建设和跨馆管理方面更积极地开展合作,为纸质资源共享项目和集体馆藏提供支撑。集体馆藏,有学者将其定义为“由数家图书馆共同管理和维护的统一集中资源”。也有学者表示“集体馆藏是一种大规模(超出单个机构范围)的图书馆馆藏”。纸质资源共享项目是建设集体馆藏的重要且不断发展的组成部分。随着数字获取、使用模式的转变和空间需求的倍增,图书馆已通过开展资源共享项目来共同实现纸质资料的长期保存。长期以来,图书馆因无法独自采全所有资源而在馆藏发展上合作,如今的图书馆因为无法独自保存所有馆藏,而在馆藏管理上合作,从而确保能共同使用丰富的馆藏资源。纸质资源共享最初仅关注期刊资源,例如:东部学术基金会(EAST)、佛罗里达高校图书馆储存库(FLARE)和西部地区储存基金会( W E S T ) 等地区性项目。现在,HathiTrust纸质资源共享项目将共享范围扩大到了专著,承诺长期保存成员馆的540万种1800万册的纸质专著。随着纸质资源共享的发展,还出现了罗斯蒙特共享纸质资源联盟和共享纸质资源合作组织等全国性合作组织。目前,研究人员正在研究并形成资源共享、保存期限、复本数量、资源发现和揭示等方面的最佳实践。对于此类项目而言,元数据标准和准确的元数据至关重要。有学者指出“集体馆藏的价值与数据的全面性和质量密不可分”。图书馆根据集体馆藏目录来决定保留何种资源,力求保留理想数量的复本。准确的元数据可以为集体馆藏的保留和剔旧提供依据。此外,相应的馆藏分析工具正在开发中,集体馆藏指南和标准的制定也将继续。 启示? 将多样性审核战略性地纳入编目、采购或馆藏管理相关工作流程,可以作为高校图书馆促进公平、多样性、包容性和可访问性的切实途径。? 图书馆应关注CDL的相关实践进展,特别是阿歇特出版集团起诉互联网档案馆一案的结果,同时为试行这项新兴服务做好准备。? “电子优先”的专著采购模式要求图书馆解决与共享相关的问题和挑战,例如通过馆际互借服务提供对电子书的完整访问权限。? 由于空间的限制和共享纸质资源合作的需要,图书馆要更主动的建设和管理存放于密集书库或异地储存的馆藏,还应关注并参与共享纸质资源标准和指南的制定。 四. 新兴技术 1 数字化转型“数字化转型”一词由Capgemini咨询公司在2011年与麻省理工学院共同提出。有业内人士将该词描述为“通过转变组织文化、劳动力和技术对高校实施优化的过程,在上述过程中部署数字化解决方案,实现机构为学生和周围社区服务的使命和目标”。与数据分析相关的数字技术对机构精简流程和提高运作效率固然重要,但仍不乏对技术安全和隐私保护的担忧。数字化转型也意味着通过现代信息技术建立新的业务模式,即利用现有知识从本质上改变一个组织——包括组织文化、管理战略、技术组合和运作程序。在人们对产品和服务期待不断变化的当下,数字化转型也可以用于改善用户体验。有学者指出,实施数字化转型需要未来的图书馆员具备“数字素养或技术知识”,掌握“跨学科方法”等新的能力,这是因为之前人工收集和处理资料的任务如今由软件完成,对于信息的评估则由AI算法完成。一些研究人员看到了图书馆发生重大变化的可能性,他们认为未来图书馆将可能是由复杂的、基于人工智能的应用程序处理的高度自动化的电子文本集合构成,从而可以提供对于文本的理解和解释,产生新的想法,进行智能化的论证以及对于现有概念的综合呈现。技术可能会从根本上改变图书馆提供的标准化服务和资源。尽管关于数字化转型的观点将技术置于组织战略的核心,但这仍是关于“改变个人信仰和组织文化”的一件事,即人们利用技术实现已设定的目标。推动变革的不是技术,而是懂得使用数字技术,创造可持续的数字解决方案,并综合利用现有知识使工作更有影响力的那些人。各组织已经采用了新的数字技术为服务增值。大数据、人工智能、机器学习、自动化、数据分析、区块链、增强现实和物联网是能够驱动变革的一系列技术,可能会对高校各部门和管理人员在制定未来研究战略以及关于学生学习和服务的战略中产生深远影响。有学者认为“高校图书馆员已成为数字化转型背景下的重要参与者”。疫情影响下的在线教学模式中,馆员不得不适应远程工作。那段时期,他们以“专家、合作者、全校服务和资源连接者”的身份出现。高校教师也不得不采用全新的方式与学生互动、评估他们的学习情况,并掌握在线教学技术。在这种环境下,数字化转型为那些“与用户更紧密合作的高校图书馆”提供了一次机遇。这从更高层次上提出的问题是:高校图书馆如何在为学校运作提供稳定支持和寻求创新解决方案(从而加强那些与机构战略保持一致的服务)之间保持平衡,以及“对于许多高校图书馆而言,最大的挑战是如何将全面的信息服务转移到线上”。云服务、计算处理能力和自动化系统的进步可以对包括高校在内的组织转型产生巨大影响。面对这些挑战,一个组织成功实施数字化转型战略和规划的决定性因素在于是否有能力配置合适的团队。团队成员必须具备合作所需的技能和素质,并能推动组织变革。同时,数字技术也会重塑工作场所并改变组织结构,这可能会让人们对自身工作前景产生怀疑。 2 学习分析数据对高校持续产生越来越大的影响,表现在机构职能和源于数据的研究两方面。大数据和学习分析技术试图为“录取决定、学籍保留和入学管理、学生生活和活动参与、学术和职业建议、学生学习和评估以及学术项目规划”提供信息支持。以下将讨论数据对高校数字化转型的影响,以及对学习分析技术的运用加强审查的必要性。学习分析研究协会将“学习分析”定义为“测量、收集、分析和报告关于学习者及其环境的数据的过程,目的是理解和优化他们的学习过程及环境”。由于疫情影响,许多高校对在线学习管理系统加大了资金投入,上述系统能收集关于学生学习习惯的数据。高校以数据为支撑的数字化转型通过分析这些数据使自身受益。高校使用学习分析技术的方式之一是通过“收集、分析和提供基于学生在校表现数据的反馈”来提供实时信息支持。教授和教学管理者可以跟踪学生的表现,并试图在挂科前进行干预,从而提高诸如学籍保留率等指标和学生福祉。有研究指出“预测学生成绩是‘教育数据挖掘’研究最多的课题之一”。利用数据和学习管理系统可以基于学生之前的表现和出勤情况及时识别有不及格或低分可能的学生,以便教师进行干预。然而,也有对于收集此类数据造成隐私侵犯的担忧,认为“学习分析以明显挑战现有专业规范、政策和隐私保护的方式,将学生的生活暴露在细粒度的审查之下”。学校必须意识到“当进行粗暴干预时,可能会让学生非常沮丧,以至于他们辍学,并可能让初犯的学生或那些自认为在大学里不受欢迎的学生更沮丧”。研究发现,使用学习分析作为一种主动措施,如直接向学生传达课程不及格的可能性,或与特定学生群体进行其他形式的交流,可能会造成一种侵犯性或歧视性。基于大数据的预测和分析可能反映乃至深化数据中已存在的种族、社会经济背景等偏见。有研究指出“高等教育中的学习技术是一个重要的关注点,因为它糅合了关于技术官僚的理性、隐私和监控问题”。该研究还引用了一些资料来加强上述论断,指出“历史上和当代的监测技术都被用于弱势群体,通过控制他们从中获得经济价值”。使用大数据和分析技术可能有助于学校更好地了解学生如何在学术上取得成功,以及影响学习能力的因素。然而,为了确保产生积极的结果,有研究建议学校“为学生和教师提供更强有力的知识产权保护,并提高所有操作的透明度,特别是在涉及学生数据时”。高校图书馆在上述过程中确定自己职能的同时,重要的是认识到学习分析技术可以作为传统评估方式的延伸,并且“如果不使用该技术可能会限制图书馆为学生教育兴趣3服务的能力”。由于馆员一直对隐私问题和知识自由较为敏感,对于学生评估和评价方式的上述变化将需要他们具备更多的技能和责任心。高校图书馆被认为处于支持教育和研究需求的最前沿,这一挑战“不仅扩展了图书馆的传统服务内容,还催生了一系列新角色和新责任”,包括但不限于为数据管理计划提供支持,对于研究数据的管理,提升人员的数据素养,以及将研究和教育流程集成到图书馆服务中。有研究作了如下总结“当前存在的问题包括馆员隐私素养存在不足,将数据用于研究或评估时缺少相应的道德审查,以及对馆员的培训不够”。除了引领开放教育资源、开放存取、开放存取出版之外,图书馆还应与研究数据储存机构合作,并提供对学校生成数据的访问。在2022年的一份研究报告中,研究人员发现“定量数据分析已获得了可能是最重要的信息素养的地位,图书馆迫切需要扩大对数据和定量分析素养的支持”。3 指的是一个人对特定主题或话题的好奇心、热情和渴望学习的态度。它是驱使个人参与教育活动、探索新思想和追求知识的动力和激情。 3 区块链有研究人员将区块链技术定义为“一个分布式和分散的公共数字账本,它被用于在几台计算机上保存动态交易数据和静态记录,如果没有网络的联通和后续所有区块的改变,记录就不能被篡改”。目前,区块链技术被用于加密货币、医疗和投票系统等,试图提供安全、持久、可靠、透明和去中心化的数据传输能力。最近图书馆行业有许多基于区块链的应用。LibChan是一个基于区块链的分布式图书馆管理系统,用于借阅实体馆藏。用户无需将所借图书归还至图书馆,而是可以直接借给下一位用户。Ethereum是一个支持加密货币的平台,但也可以用于建立基于区块链的智能合约,通过网络应用程序实现外借图书。有团队提出了一种新的电子书流通系统,使用Ethereum区块链网络来存储敏感数据,并在多种设备上提供用户友好的阅读体验。此外,Publica是一个使用区块链技术的平台,通过在作者和支持者之间提供“以作者为中心的点对点金融关系”,创新图书的资助、传播和阅读方式。Orvium是一个基于区块链的数字出版和版权管理平台,任何人都可以在上面注册和出版图书,接收代币,并创建一个独特的、可验证的记录供所有人访问。该平台致力于帮助研究人员更快地出版学术成果和扩大学术网络。ARTiFACTS是一个基于区块链的平台,让研究人员从研究伊始就可以安全和永久地记录学术成果,目的是确保其工作记录可溯源。区块链技术的未来应用数不胜数,但图书馆中的大多数区块链应用项目仍处于开发阶段。接下来的应用更有前景,很快就可以在图书馆实现。区块链技术可以通过更好的记录管理提高用户使用馆藏资源和馆际互借的效率,也可能为新的分布式大规模元数据系统和数字内容的点对点共享提供支持。 4 人工智能人工智能工具和服务的数量一直在快速增长。特别值得一提的是ChatGPT和Dall-E,两个都是OpenAI公司的产品,该公司表示其使命是“确保通用人工智能(在最具经济价值的工作中胜过人类的高度自主的系统)可以造福全人类”。截至2023年初,这些工具免费对公众开放,之后将收费。Dall-E可以创建独特的图像,并对现有图像进行逼真的修改——只要用户提供如“描绘了机器人的彩色玻璃窗”这样的自然语言提示。另一个图像生成人工智能系统Midjourney根据先锋派电影制作人亚历桑德罗·佐杜洛夫斯基和电影Tron的相关提示创建了令人惊讶的图像——引发了许多关于美学、艺术、作者身份和人类创造力的问题。人工智能工具ChatGPT还可以给出自然语言提示,如“写一首关于开车上班的俳句”或“用400个词描述哈姆雷特和格特鲁德之间的关系”,并提供有时非常准确且类似人类的回答。它还可以基于自然语言提示输出代码或者提供职业建议。一个广泛可用的且似乎可以产生人类文本的人工智能系统在学术和教育界引起了轩然大波。国际机器学习会议宣布“禁止包含从ChatGPT等大规模语言模型生成的文本的论文,除非生成的文本作为论文实验分析的一部分”。纽约市教育局屏蔽了ChatGPT。罗格斯大学和乔治华盛顿大学等学校的教师正在逐步减少回家作业、开卷作业或类似“写五页关于某方面的内容”的功课。不过也有其他教育工作者将ChatGPT视为提高学生写作水平的工具。值得注意的是,ChatGPT陷入了科学家称为“幻觉”的问题,ChatGPT对什么是正确的或真实的缺乏概念。OpenAI警告称“ChatGPT可能偶尔会产生不正确的信息”。纽约大学一位教授表示,ChatGPT不是一个将彻底改变许多学科的人工智能,而是一个模仿大师。更麻烦的是,ChatGPT会给出医疗方面的错误信息,并提供(并不存在的)引用统计数据和《美国医学协会杂志》文章。虚假信息运动的实施可能变得更廉价,使得虚假信息更容易充斥社交媒体,创造“一个我们无法知道该信任什么的世界”。谷歌、微软和其他硅谷的公司正大力投资类似的人工智能工具。路透社新闻研究所发布报告指出,未来几年间,自动化或半自动化媒体将产生“25%的互联网数据”。 启示? 受联邦资金资助的研究机构需要在2025年前公开所有研究出版物和数据集,图书馆在这一领域大有作为。? 高校图书馆可以成为高校数字化转型的重要变革力量,对在线教学、图书馆运营、数字资源和服务产生影响。? 越来越多的高校图书馆员需要获得传统职业资格要求之外的技能,包括涉及数据和学习分析、研究数据服务、开放教育资源和数字出版的知识。? 区块链技术还处于早期阶段,且实施过程中面临隐私、复杂性、成本和可扩展性方面的诸多挑战,拥有技术专长、熟悉政策和接受良好培训的高校图书馆员将可能引领该技术在元数据、研究数据、馆藏采访等领域的未来发展。? 在生成独特的图像和文本的同时,人工智能技术也可能被用于不道德的应用,如传播错误和虚假信息。高校图书馆可能有机会通过研究、教学干预、政策制定或促进关于该主题的跨学科学术对话来应对这些挑战。

    发布时间: 2023-12-01

  • 63. 专题 | ChatGPT等人工智能技术对文献情报工作影响
    黄雨馨
    “ChatGPT等人工智能技术对文献情报工作影响”专题序 张智雄 中国科学院文献情报中心 北京  100190?       2016年是人工智能发展史上值得关注的一年。在这一年的3月,阿尔法狗(AlphaGo)在围棋比赛中战胜人类冠军,在这一年的10月,美国国家科学技术委员会发布《国家人工智能研究与发展战略计划》。但也就是在这一年的6月,很多人(当然包括我)都没有注意到,刚成立半年的人工智能公司OpenAI明确了四项研发目标,将研制通用机器人和具有自然语言理解能力的机器人作为其中两项重要的技术目标开展研究。       时间刚刚过去六年多,从2022年11月到2023年3月,OpenAI连续推出的两记重拳ChatGPT和GPT-4彻底打破了人类对当前人工智能已具备的能力的认知。ChatGPT和GPT-4所表现出的掌握知识、应用知识和解决问题的能力让世人为之瞠目。       目前,各行各业都在解析以GPT系列为代表的人工智能技术“为什么能”,都在探讨以GPT系列为标志的人工智能技术将对自身领域带来哪些冲击和影响,都在分析如何在各自领域利用GPT等人工智能技术,都在研究人工智能时代各自领域应如何作为。       面对人工智能技术的飞速发展,文献情报领域当持何种态度?又当如何作为?2023年2月21日,国家科技图书文献中心(NSTL)与中国科学院文献情报中心共同主办了“ChatGPT对科学研究和文献情报工作的影响”专题研讨会。会议邀请了人工智能、文献情报等领域的学界和业界的专家对相关问题进行了研讨,并发布了由国家科技图书文献中心和中国科学院文献情报中心项目团队共同研制的《ChatGPT对科学研究和文献情报工作的影响》研究报告。       在本次会议上,众多与会专家认为我国文献情报领域有必要对ChatGPT的基础技术体系、ChatGPT的智能水平、ChatGPT对我国语言大模型研发有什么借鉴之处,以及ChatGPT对文献情报领域将会带来哪些冲击和影响做进一步的深入研究。由此,提出撰写“ChatGPT等人工智能技术对文献情报工作影响”专题研究论文,得到了与会专家的大力支持。       经过相关专家的努力,本专题四篇论文完稿并结集出版。论文《ChatGPT的技术基础分析》由中国科学院文献情报中心的钱力老师牵头撰写,主要目标是通过相关资料,解析ChatGPT的底层技术基础,理清ChatGPT的技术原理;论文《ChatGPT中文性能测评与风险应对》由北京理工大学计算机学院的张华平老师牵头撰写,目标是测评ChatGPT处理中文问题的智能化水平,分析ChatGPT的潜在风险及应对策略;论文《ChatGPT给语言大模型带来的启示和多模态大模型新的发展思路》由中国科学院自动化研究所的赵朝阳老师牵头撰写,主要目的是在剖析ChatGPT的技术原理的基础之上,探讨我国多模态大模型的研究和发展思路;论文《ChatGPT对文献情报工作的影响》探讨以ChatGPT为代表的人工智能技术对文献情报工作的启示和影响,为文献情报领域提出在人工智能时代下的发展建议。       在四篇论文的写作过程中,作者团队得到了很多专家学者指导和帮助。作者团队不断吸收了相关专家的意见和建议,努力提高论文质量,完善相关研究。当然,由于人工智能技术发展迅速,ChatGPT、GPT-4等新技术成果刚刚面世,更兼作者团队能力水平有限,在论文中的论述难免有不当之处,希望各位同仁多加批评指导。

    发布时间: 2023-10-10

  • 64. 社交网络用户虚假信息揭露行为研究:认知与情绪双路径视角
    程冰
    本文聚焦社交网络用户虚假信息揭露行为,从认知与情绪双路径视角深入研究,旨在促进社交网络健康发展。研究创新在于揭示认知和情绪在揭露意愿及行为中的作用机制,为后续研究提供新思路。 研究通过问卷调查获取847份有效问卷,运用结构方程模型和模糊集定性比较分析实证研究。结果表明:认知因素中,卷入度、感知价值、感知风险和自我效能正向影响揭露意愿,其中自我效能影响最显著;情绪因素方面,情绪唤醒程度越高,揭露意愿越强烈,消极情绪下更易产生揭露意愿。在认知因素影响下,用户更关注信息质量,情绪因素影响下则更重视信源声誉。揭露意愿对揭露行为有显著正向影响,自我效能和情绪唤醒起正向调节作用。同时发现两条虚假信息揭露意愿触发路径,自我效能皆为核心条件,感知价值为边缘条件。 基于研究结论,文章从多维度构建虚假信息用户防御体系:完善信息素养教育,提升用户鉴别能力;建立社交网络用户把关制度,优化举报与反馈流程;设计情绪干预措施,采取差异化引导策略;重视虚假信息内容监测预警,加强辟谣平台建设;强化信源声誉管理,优化标签显示;建立激励机制,提升用户揭露积极性。 研究存在局限性,如情绪测量方法受影响、未深入探索动态因素等,未来可结合新技术手段及进一步探索动态因素影响。

    发布时间: 2024-11-22

  • 65. 中美高校图书馆学习空间服务对比研究
    程冰
    学习空间是高校图书馆为学校师生提供辅助教学科研活动的重要场所。文章通过网络调研的方式,以中美两国具有代表性的28所高校图书馆为研究对象,从空间类型、空间管理以及设备配置三大方面,对中美两国的高校图书馆学习空间服务现状进行对比分析,研究发现目前我国高校图书馆学习空间服务已取得一定的成效,但与美国高校图书馆相比,存在空间类型单调、管理制度不完善、系统设备不够健全、用户需求未得到足够重视等问题,因而提出相应的改进策略,如丰富学习空间类型,建设多元化学习空间;完善空间管理制度,组建专业服务团队;优化空间设备配置,满足用户多元化需求;注重用户需求体验,实现空间服务价值。 来源:蒋逸颖,蒋逸婷.中美高校图书馆学习空间服务对比研究[J].图书馆研究与工作,2024,(06):15-21+42.

    发布时间: 2024-07-26

  • 66. 生成式人工智能与教育变革:价值、困难与策略
    程冰
    作为现代技术发展的高级形态,生成式人工智能对教育的变革已成必然。那么,在教育领域中,生成式人工智能究竟有什么价值,价值实现过程中会遇到哪些困难,又该如何应对困难以实现价值?文章系统回答了这三个问题。首先,文章提出了生成式人工智能的三层教育价值——工具层协助学生、教师和教学管理人员促进教学变革,融合层联合多项技术重塑教育体系,终极层助力回归教育本质。然后,文章探讨了价值实现面临的三层困难——教育应用难深入、系统变革难推进、效能提升难显著。最后,文章针对三层价值和困难,总结了加强产品技术研发,匹配师生实际需求;打通技术融合壁垒,重构周围组织结构;加强基础机制研究,科学推进因材施教三项策略。文章通过系统研究生成式人工智能教育变革,旨在为我国利用生成式人工智能技术促进教育数字化转型提供系统的理论参考与实践指导。

    发布时间: 2024-07-26

  • 67. 上海社会科学院信息研究所王世伟研究员
    闫亚飞
    上海社会科学院信息研究所王世伟研究员做了题为《当前智慧图书馆发展的六大突破与进展——基于上图东馆的观察与思考》的报告。基于上图东馆的观察与思考,他介绍当前智慧图书馆发展的六大突破与进展。一是智慧图书馆从点的突破迈向系统能力提升的新范例,东馆运用图书馆大脑技术,配置多样化的机器人服务、各类服务的全流程管理等。二是当代图书馆阅读推广的新诠释,东馆实现了建筑是可阅读的、雕塑是可阅读的、人物是可阅读的。三是图书馆空间艺术设计创新的新实践,东馆将系列公共艺术项目纳入整体设计,增强公共图书馆空间的生命力与阅读学习的延展性。四是中国式现代化图书馆新样本,东馆遵循中国式现代的五大特点。五是中国智慧图书馆体系建设的新增长级,东馆率先试验发展智慧图书馆的样本案例,探索了创新理念、变革实践、突破服务和空间布局。六是世界智慧图书馆发展进程中的新探索,东馆众多原创性探索成为智慧图书馆发展的先行者和排头兵。上图东馆是对中国特色智慧图书馆发展的全新探索与成功实践,不仅书写出中国特色智慧图书馆历史发展的崭新篇章,而且标志中国公共图书馆事业跃升为世界智慧图书馆发展的增加级。

    发布时间: 2023-07-11

  • 68. 《2023年美国公共图书馆技术调查总结报告》发布
    程冰
    当地时间2024年7月9日,美国公共图书馆协会(Public Library Association,PLA)发布了《2023年美国公共图书馆技术调查总结报告》(2023 Public Library Technology Survey Summary Report)。这项全国性调查更新了美国公共图书馆在技术能力、用户资源、基础设施、数字素养和人员配备方面的新兴趋势信息,调查数据对于了解图书馆作为社区知识创新中心如何发挥作用,以及如何继续发展以满足用户需求方面有着不可低估的价值。 该报告解决了如下问题:图书馆专业人员如何在其社区推进数字公平?图书馆向用户借出了哪些类型的技术设备?与2020年相比,提供这些设备的图书馆是增加还是减少了?图书馆在提供技术资源和技术服务方面主要挑战是什么? 2023年技术调查的主要发现包括: ·近一半的图书馆(46.9%)为借阅者提供互联网热点,较2020年增加14.4%; ·大约四分之一(24.6%)的图书馆拥有数字媒体制作设备,超过三分之一(39.5%)的图书馆拥有创客制作设备; ·95.3%的公共图书馆提供某种形式的正式或非正式数字素养培训,近30%的公共图书馆提供数字导航员项目来帮助用户进行数字化操作; ·近五分之一(19.7%)的图书馆参与了地方、州或地区层面的数字公平或数字包容联盟组织; ·95%的图书馆提供电子书和(或)电子有声书,57.5%的图书馆为读者提供流媒体文件和可下载媒体文件; ·联邦资金对于支持图书馆技术需求至关重要:超一半(52%)的图书馆单独或作为联盟的一部分申请了E-rate项目(美国政府出台的“教育信息服务折扣政策”)支持; ·订阅费用或支付条款是影响图书馆提供数字内容的首要因素(85.7%的图书馆选择了这一选项)。 更多内容请参见原文。

    发布时间: 2024-07-26

  • 69. 美国高校图书情报专业信息组织类课程设置分析
    杨小芳
    摘要 这篇论文主要研究了美国15所高校图书馆与信息科学专业硕士课程中信息组织类课程的设置情况,分析了不同高校在课程类型、内容、教学模式和考核方式等方面的差异,并为我国高校制定更完善的信息组织课程设置方案提供了参考。 方法 通过对美国15所高校LIS专业硕士信息组织类课程设置情况进行研究,重点分析不同高校的信息组织类课程类型、课程内容、教学模式和考核方式等方面的差异。通过总结美国LIS专业信息组织课程设置特点,为我国高校制定更加完善的信息组织课程设置方案提供参考,提出顺应我国国情发展的信息组织课程建议,培养新时代的复合型人才。 结论 这篇论文通过对美国15所高校LIS专业硕士信息组织类课程设置的研究,分析了不同高校在课程类型、内容、教学模式和考核方式等方面的差异,为我国高校制定更完善的信息组织课程设置方案提供了参考,并提出了适应我国国情发展的信息组织课程建议,以培养新时代的复合型人才。

    发布时间: 2023-12-01

  • 70. 高等院校人工智能素养教育的内容体系与发展理路
    饶海侠
    以人工智能为核心驱动力的第四次工业革命已经来临,各国逐渐重视培养具备人工智能素养的各类人才。高等院校是各类高层次人才的重要孵化地,必须与时俱进地开展人工智能素养教育。2022年2月05日,王奕俊等在《黑龙江高教研所》期刊上发表《高等院校人工智能素养教育的内容体系与发展理路》一文。文章对人工智能素养的内涵进行释义,从人工智能知识、人工智能技能、人工智能意识、人工智能伦理和人工智能思维等五个维度构建高等院校人工智能素养教育的内容体系,并提出高等院校发展人工智能素养教育的理路。 1、研究内容 1.文章首先阐述了人工智能素养的释义,进行了历史梳理,阐述了从信息素养到数字素养再到如今人工智能素养的过程;而后从技术属性和社会属性对人工智能技术的超越性进行了逻辑审思,提出了人工智能素养应当包含人工智能知识、人工智能技能、人工智能意识、人工智能伦理和人工智能思维等五个维度。 2. 文章廓清了高等院校人工智能素养教育的内容:掌握人工智能基础知识;获得人工智能应用技能;甄别人工智能的双重影响;形成以人为本的价值认同;发展智能时代的高阶思维。提出人工智能素养是一种综合能力,人工智能素养的五个维度相互作用相互影响,高校在开展人工智能素养教育时应该充分把握人工智能素养五个维度的相互关系。 3.文章提出了人工智能素养教育的发展路径,对未来如何进行人工智能素养教育提出了建议与展望。 2、研究结论 1.文章指出人工智能素养教育的内容是:以事实知识、原理知识、技能知识、知道是谁的知识为核心的人工智能知识;获得识别人工智能,分析人工智能,应用人工智能,创造人工智能等应用技能;从人工智能影响、需求、安全三个意识来甄别人工智能的双重影响;形成以人为本的价值认同;发展人工智能时代的高阶思维。 2.文章最后提出了高等教育人工智能素养教育的发展理路:关键是要研究与制定人工智能素养标准;要以革新人才培养理念为基础;以完善人工智能素养课程建设为核心;提交教师人工智能素养是人工智能素养教育稳定进行的保障。

    发布时间: 2024-10-31

  • 71. 年度重磅 | 科睿唯安发布2024年度“全球高被引科学家”名单
    程冰
    一、简介 英国伦敦,2024年11月19日——科睿唯安今天发布了2024年度“全球高被引科学家”名单,遴选全球高校、研究机构和商业组织中对所在研究领域具有重大且广泛影响的顶尖科研人才。 来自全球 59 个国家和地区 1200 多家机构的 6636 名科学家入选2024年度名单。科睿唯安科学信息研究所(ISI?)的文献计量学专家和数据科学家基于 Web of Science 核心合集(Web of Science Core Collection?) 引文数据以及定性分析,开展了严格的评估和遴选。 2024年度名单提供了对全球顶尖科研人才现状的重要见解,并揭示了不同国家、地区和机构的发展趋势。中国内地和香港入选人员占比显著上升,美国占比则逐渐下降。这种趋势反映出顶尖科研和学术贡献在地理、政治和文化层面正在经历再平衡的过程。 二、2024年度名单主要亮点 1.美国仍是“全球高被引科学家”名单入选人次最多的国家,共 2507 人次入选,占总人次的 36.4%。美国入选人次占比自2018年(占比 43.3%)以来持续下降。 2.中国内地入选人次数再次大幅增加,共 1405 人次入选,占比为 20.4%,是2018年的逾两倍。在全球高被引科学家上榜人次前十的机构中,清华大学(92人次)上升一位,取代美国国立卫生研究院(90人次),位列第四。 3.来自 59 个国家和地区的 6636 名科学家入选全球高被引科学家名单。85.4% 的入选者来自于 10 个国家和地区,74.4% 的入选者集中于排名最高的5个国家和地区。 4.一些杰出科学家同时在多个ESI学科入选:216 人入选两个学科,22 人入选三个或以上学科。 5.美国一些州入选人次表现突出,如:加利福尼亚州有 552 人次入选,几乎与英国相当。 6.中国香港入选人次增长强劲,达到 134 人次,占全球总人次的 1.9%。 7.入选者包括在制药、生物技术、太阳能技术、信息技术等不同领域全球领先企业或机构中从事突破性科研工作的研究人员。这些企业或机构来自全球多个国家,包括:阿斯利康(1人次)、拜耳(2人次)、华大基因(4人次)、DeepMind Technologies(1人次)、谷歌(4人次)、微软(2人次)和罗氏(5人次)。 8.在包括政府和其他类型研究机构在内的所有机构中,中国科学院以 308 人次荣登榜首,多于去年的 270 人次。其他排名靠前的政府或非大学机构包括:美国国立卫生研究院(90人次)、德国马普学会(56人次)和美国纪念斯隆·凯特琳癌症中心(44人次)。 图 1 2024年度全球高被引科学家上榜人次前十的国家 图2 2024年度全球高被引科学家上榜人次前十的机构 三、2024年度全球高被引科学家名单的评估和遴选过程 科睿唯安“全球高被引科学家名单”每年评选一次,旨在表彰对所在学科做出重大贡献且具有全球影响力的自然科学家和社会科学家。 今年共有 6636 位研究人员共 6886 人次入选全球高被引科学家名单。由于一些研究人员在一个以上ESI学科入选,因此入选名单的总人次数超过了入选科学家的总人数。 对国家/地区和机构的分析是基于 6886 的总人次。在2024年度名单中,3560 人次入选 20 个ESI学科,3326 人次入选跨学科。 今年的名单是根据2013年至2023年这11年期间所发表的高被引论文数量遴选得出。遴选方法基于科睿唯安科学信息研究所文献计量专家对SCIE和SSCI收录期刊中高被引论文数据进行严格评估和整理。 在2024年度名单发布之前,科睿唯安与入选科研人员进行了广泛的验证和反馈,以确保名单准确性。

    发布时间: 2024-11-22

  • 72. 科学数据素养的概念辨析以及过程-目标结构体系
    饶海侠
    科学数据素养的概念辨析以及过程-目标结构体系 科学数据素养是数据密集型时代应运而生的概念。2019年9月20日,学者秦小燕和初景利在《图书情报工作》期刊上发表《科学数据素养内涵结构研究》一文,该文章梳理了目前学者在信息素养和科学数据生命周期方面的理论研究,深入剖析科学数据素养的内涵以及该素养与其他素养之间的关系,进而构建了科学数据素养过程-目标的内涵结构体系。 一、研究内容 作者通过对相关文献的调研和分析,发现现有研究普遍从两种方式出发理解科学数据素养的内涵:数据行为过程和教育目标,由此作者基于信息素养理论、科学数据生命周期理论,构建了科学数据素养的过程结构模型和目标结构体系,并将两个模型结合构成科学数据素养过程-目标结构体系。 1.内涵辨析 作者认为在文中辨析了科学数据素养与信息素养、数字素养、科学素养、统计素养之间的关系。认为核心是将批判性思维贯穿于数据利用与处理的全过程,利用数据解决科学问题的能力。 (1)科学数据素养与信息素养:作者认为信息素养反映查找、获取、评价和利用信息的能力,科学数据素养反映的是理解、使用、管理科学数据的能力,科学数据素养是信息素养的延伸和扩展,建议应成为高等教育的重要内容。 (2)科学数据素养与数字素养:作者认为科学数据素养强调了数据生产者、使用者和管理者的利益相关方,要求的能力更专深。数字素养强调掌握和应用数字技术与网络知识,确定、组织、理解、评估和创造信息,是终生学习的过程。 (3)科学数据素养与科学素养:作者认为数据素养丰富了科学素养的内涵,通常通过科学知识、研究方法过程、以及科技带来的影响三方面考察科学素养,科学素养涉及科学思维体系、价值观、文化认同和科学信息交流模式。 (4)科学数据素养与统计素养:作者认为数据素养为统计素养赋予丰富内涵。统计素养的核心是对数据的辩证思考与应用,数据科学和统计学的边界越来越模糊。 2.科学数据素养的内涵结构 作者考察大量的科学数据素养项目、教育实践模式以及课程大纲,分析内在逻辑,从利用行为或解决过程、各环节对数据主体的要求这两方面考虑,梳理提出了科学数据素养的过程-目标结构,作者对过程中每个阶段的要求可归结为目标,目标的具体表现形式则是行为过程,目标经认知、行为和情感层面的升华和内化形成科学数据素养。以下是“科学数据素养过程 - 目标结构体系”(下图摘自论文原文) 二、结论 通过建立科学数据素养过程-目标结构体系,可以为科学数据素养教育实践的展开提供参考,并且有利于科研人员制定完善的科学数据素养能力评价体系和评价标准,同时,该体系的建立明确了科学数据素养的目标和实现路径,为该领域的研究奠定了理论基础。此外,作者提到该框架一个动态的理论分析框架,具体分析内容将随着时代发展而自我调整和发展。 三、阅读推荐 文中提到了美国大学与研究图书馆协会( ACRL) “高等教育信息素养能力标准”,英国国立与大学图书馆协会( Society of College,National and University Libraries,SCONUL)信息素养七要素标准,澳大利亚与新西兰信息素养研究会( Australian and New Zealand Institute for Information Literacy,ANZIIL) “信息素养框架: 原则、标准与实务”、联合国教科文组织( United Nations Educational,Scientific and Cultural Organization,UNESCO) 2013 年发布的“全球媒体与信息素养评估框架”等内容,推荐进一步信息素养教育领域相关的学者扩展阅读。 以上内容经编译整理,详细内容请参考[1]秦小燕,初景利.科学数据素养内涵结构研究[J].图书情报工作,2019,63(18):30-39.DOI:10.13266/j.issn.0252-3116.2019.18.004.

    发布时间: 2024-01-19

  • 73. 大模型下人工智能生成内容嵌入数字素养教育研究
    饶海侠
    在全球加速步入数智社会的时代背景下,先进数字技术深度融合实体经济的创新发展格局使得不少国家和地区陆续暴露出数字均等化程度与区域发展水平的正向关联, 亟待大力培养公众的数字化意识、 数字技术知识、 数字技能和数字化应用能力。2023年6月10日,雷晓燕等在《现代情报》中发表了《大模型下人工智能生成内容嵌入数字素养教育研究》一文。文章基于数字生态下全域升级的数智融合使得数字素养成为个体生存技能,结合超大规模的跨模态智能算法模型的技术解构和应用价值,描绘大模型下人工智能生成内容嵌入数字素养教育的模块组成与风险对策。通过大模型下人工智能生成内容嵌入数字素养教育的有序化,为构建全民普惠的数字素养教育机制提供有力支撑,助力实现数字社会公平发展。 1、研究内容 本文在系统梳理数字素养教育的庞大受教群体、 复杂教学内容、 终身培育需与参差教学环境的基础上, 积极勾勒在完整的培育周期内充分嵌入人工智能生成内容的数字素养教学情境、 教学资源、 教学流程和教学反馈的科学框架, 全方位助力培养受教群体的数字创新思维与数智社会责任感。 文章阐述了数字素养内涵的转变与数字素养教育需求,以及大模型下人工智能生成内容的技术解构与应用价值,确定了大模型下人工智能生成内容嵌入数字素养教育的模块组成有(1)虚实融合的数字素养情境教学模块;(2)智能处理的数字素养教学资源模块;(3)数智协同的数字素养教学流程模块。描述了大模型下AIGC嵌入数字素养教育的模块组成和风险对策,从简单文本、图形或音频数据生成到复杂结构的超大规模和超多模态的AIGC的发展历程。讨论了AIGC的覆盖范围、交互状况、展示形式和应用场景以及数字素养在数智化转型中的变化,包括云计算、Web3、深度学习等数字技术知识。强调了数字素养教育的多态融合发展态势。 2、研究结论 文章指出AIGC在数字素养教育中有很大的作用: 1 通过大模型下人工智能生成内容(AIGC)的有序优化,可以为构建全民普惠的数字素养教育机制提供有力支撑。 2. AIGC在数字素养教育中的应用有助于实现数字社会的公平发展。 3. 论文提出了四个主要模块,包括情境教学、教学资源、教学流程和教学反馈,这些都是AIGC可以嵌入和发挥作用的领域。 4. 识别了在AIGC应用中可能出现的风险,包括错漏风险、诚信风险和侵权风险,并提出了相应的风险对策。 5. 建议采用可解释的偏离模型和强化生成风险的流程治理,以确保AIGC应用的透明度和安全性。 6. 强调了构建以人为本的人机协同在AIGC应用中的重要性。 7. 提出了逐步构建全民受益的智能化数字素养终身培育体系的目标。 8. 通过AIGC的嵌入,可以推动数字社会的健康发展。 论文的结论强调了AIGC在提升数字素养教育质量和效率方面的重要性,并指出了实现这一目标所需采取的策略和措施。同时,文章也意识到了潜在的风险,并提出了相应的解决方案。

    发布时间: 2024-10-31

  • 74. 2024年高等教育趋势观察
    徐宏帅
    2024年高等教育趋势观察 2024年1月8日,EDUCAUSE发布2024高等教育趋势观察。该报告重点关注高等教育中持续或新兴的七大宏观趋势所带来的员工、文化和技术变革。在这三个转变领域,报告了各个趋势对机构的主要影响以及机构对每个趋势采取的应对措施。许多趋势的主题和问题与《2023年高等教育趋势观察》保持一致。 2024 热门趋势 2024 年 10 大 IT 问题调查的受访者不仅获得了 20 个 IT 问题的清单,还列出了围绕高等教育领域出现的 20 个更广泛趋势。对于每个新兴趋势,调查中要求受访者评估对其机构的技术战略、政策和/或实践的影响程度。 IT趋势排名 1对数据安全和防范个人隐私威胁的需求日益增加 2对持续的混合和远程工作安排的需求 3更多呼吁以数据为依据的决策和报告 4更加关注幸福感和心理健康 5 (并列)加大力度创造公平和包容的环境和体验 5 (并列)加大对数字化转型和机构韧性的力度 6更加注重改善混合和在线学习 趋势策略 在报告的这一部分中,研究者仔细研究了受访者选择的最重要的新兴高等教育趋势,并总结了他们正在探索或实施的规划和行动,以应对每种趋势。应对措施已按制度转变的三个主要领域进行分类:劳动力、文化和技术。(具体策略可参见原文)

    发布时间: 2024-04-29

  • 75. 中国科学院作者发表OA论文指南(2024年版)
    程冰
    中国科学院是推动中国开放获取发展的重要力量。开放出版是开放获取的基本形式之一,指受公共科研资助的学术期刊论文经同行评议发表后,立即通过期刊网站开放获取,供社会公众免费阅读下载。中国科学院文献情报中心持续关注国际开放获取动态,积极开展开放获取实践,与多家出版社达成开放出版合作,为作者争取开放出版权益。 本指南从中国科学院作者的角度,聚焦开放出版的关键问题:APC支付模式与减免优惠、期刊选择、作者身份等,为作者发表开放获取论文和申请开放出版资助提供建议。

    发布时间: 2024-10-31

  • 76. 《中国早期职业研究人员开放科学技术指南》发布
    程冰
    中国是全球OA论文发表最多的国家,形成了一批我国自主建立和运营的开放科学平台,出现了由我国早期职业研究人员团体发起的开放科学社区。在我国的政策、基础设施、研究文化背景和条件下,参考国外已有的针对早期职业研究人员的开放科学实践指导文件,我们制定了该《中国早期职业研究人员开放科学技术指南》。作为一本开放科学“活”工具书,帮助早期职业研究人员快速方便地开始开放科学实践,与尽可能多的人分享研究。 国际上通用的“早期职业研究人员”范畴: “早期职业研究人员”(Early Career Researcher, 简称ECR),通常指刚开始科学研究职业生涯的研究人员。不同国家和机构对此术语的定义可能略有不同,包括研究生、博士后研究员、获得博士学位后的5-10年的研究人员,在我国一般被称为青年学者、年轻科研人员等。 在转向更“开放”科学的过程中,早期职业研究人员(ECR)至关重要,因为他们是开放科学运动及制度变革的当前参与者和未来决策者,对于塑造未来的科学文化至关重要。提升ECR的开放科学能力,也一直是全球主要国家、科研机构、科研资助机构实施开放科学战略的优先事项。 指南的共同编写者们认为,开放科学对早期职业研究人员的价值包括: 对于ECR来说,尽早地、力所能及地开展开放科学实践和活动,对自己的职业生涯发展具有积极意义,包括但不限于: (1)提高研究质量和研究信心。以透明的方式规划工作流程时,研究工作更容易被别人重复使用,错误更容易识别和纠正,这反过来又能加强和提高其影响力。另外,提高所用方法的透明度有助于建立对科学方法的信心。 (2)增加个人科研影响力:通过开放获取出版、共享数据和研究成果可以提高研究的可见性和影响力,从而加速职业发展。有研究已经表明,开放获取可以增加论文的引用,还可以帮助您收获多次引用(例如代码的引用,数据的引用,文章的引用...)。 (3)促进合作:通过共享成果,您可以更容易地与其他研究人员建立合作,这反过来又可以带来新的研究机会和合著。开放科学的实践还鼓励跨学科和国际之间的合作,这是一个扩展网络、建立合作伙伴关系以及参与更大规模研究项目的机会。 (4)提高个人的学术声誉和诚信度:开放获取数据和方法可以让其他研究人员复制和验证研究结果,这表明了您对自己研究真实性的承诺和“信心”。在向期刊投稿时共享数据也会更得到审稿人的青睐。 (5)适应科研规范和资助要求:越来越多的科研资助机构和期刊要求研究成果开放获取。通过积极参与开放科学,您可以更好地满足这些要求并增加获得资助的机会。从普适性角度,本指南的技术路线涵盖ECR研究周期的5个阶段:第一阶段、准备选题;第二阶段、研究设计;第三阶段、分析研究;第四阶段、出版交流;第五阶段、评审与推广。在每个阶段列出了ECR可以采用的开放科学实践与操作方法。 本指南目录如下:欢迎开展本指南的合作与交流:本指南是一本开放协作、广泛参与贡献的开放科学“工具书”,希望更多的开放科学实践者、开放科学案例贡献者、对开放科学感兴趣的科研人员等,与我们联系和合作,共同加入到本指南的撰写、完善和更新,推动该指南更好地服务于广大早期科研人员,以及成为开放科学的“交流阵地”。 本指南的共同撰写者如下:陈雪飞,刘静羽,许哲平,黄金霞,王昉,王元新(中国科学院文献情报中心)胡传鹏(南京师范大学)卫垌圻(中国科学院心理研究所)张杰龙(中国科学院大学)陈  蕾(浙江大学)宁  劲(中国科学技术大学)许岳培(中国科学院心理研究所)刘  铮:(香港中文大学(深圳))徐  琛,葛  纪,李子璐(中国科学院空天信息创新研究院)刘一鸣(北京大学) 联系邮箱:openresources@mail.las.ac.cn

    发布时间: 2024-07-26

  • 77. Gartner发布《2025年十大战略技术趋势》
    程冰
    2025 年十大战略技术趋势 2024年10月22日,Gartner发布了《2025年十大战略技术趋势》报告,其趋势分为三大主题。对于这些技术趋势的追踪有助于IT领导者以创新方式塑造企业未来。 一、AI的当务之急和风险 1. 代理式人工智能(Agentic AI):能独立决策并行动以实现目标,2028年至少15%日常工作决策将由其自主完成。可助力员工管理项目、自动化客户体验、改变决策制定,虚拟员工能协助工作,但需保护措施确保意图一致。 2. 人工智能治理平台(AI Governance Platforms):管理和控制人工智能系统,确保其负责、道德。到2028年,使用该平台的企业将在客户信任度和监管合规性方面领先。可评估风险、指导模型、跟踪监控,虽能确保人工智能使用,但建立一致做法困难。 图表 1人工智能治理平台要素 3. 虚假信息安全(Disinformation Security):帮助识别可信内容,目标是确保信息准确等。2028年50%企业将采用相关产品等,可检测合成媒体、监控言论、防止假冒,不过需持续更新的团队方法。 图表 2什么是虚假信息安全 二、计算的新领域 1. 后量子密码学(Post Quantum Cryptography):防范量子计算解密风险。2029年量子计算进步将使多数传统非对称加密技术不安全,可保护财务、知识产权数据及加密信息,但算法不能直接替代现有算法,应用程序需测试重写。 图表 3加密灵活性时间轴 2. 环境隐形智能(Ambient Invisible Intelligence):技术融入环境提供自然体验。2028年早期实例将解决眼前问题,可在零售、办公、医疗保健领域发挥作用,不过存在隐私问题。 图表 4环境隐形智能举例 3. 节能计算:设计运行时减少能源消耗和碳排放,多数IT组织首要考虑碳排放。可削减数据中心成本、助力产品开发、降低办公网络能耗,但面临技术、成本、能源价格等挑战。 图表 5控制信息技术的可持续性 4. 混合计算(Hybrid Computing):结合多种技术解决复杂计算问题。未来组织将采用混合设置,可实现可扩展性、提高安全性、加快创新,但新兴技术需专业技能,存在安全风险且复杂昂贵。 图表 6一种简化的混合计算机构 三、人机协同 1. 空间计算(Spatial Computing):增强物理世界功能,2028年20%的人每周将有一次沉浸式体验。可用于团队协作、员工培训、购物体验改善,但头戴式显示器存在诸多问题。 2. 多功能机器人(Polyfunctional Robots):能执行多种任务并灵活切换。2030年80%人类将每天与其打交道,可在仓库、医疗、现场服务中工作,不过价格和功能要求未达成共识。 图表 7多功能机器人:物理创新的新浪潮 3. 神经增强(Neurological Enhancement)利用技术提高认知能力,2030年60%IT员工将受益。可缩短外科医生实习期、提供个性化教材等,但初期存在价格高、有侵入性和安全道德问题。

    发布时间: 2024-11-22

  • 78. LIBER与DFFU发布联合报告:《图书馆技术背景下的公私合作伙伴关系》
    程冰
    当地时间2024年7月1日,欧洲研究型图书馆协会(Association of European Research Libraries,LIBER)与丹麦研究型图书馆协会(Danske Fag-, Forsknings- og Uddannelsesbiblioteker,DFFU)联合发布了一份题为《图书馆技术背景下的公私合作伙伴关系》(Public-Private Partnerships and Collaborations in the Context of Library Technology)的试点研究报告。 该报告重点关注图书馆创新技术领域,是丹麦亚历山德拉研究所(Alexandra Institute in Denmark)于2023年10月至2024年2月进行的一项定性研究得出的结果,研究试图解决以下两个关键问题: ·当前合作伙伴关系的特点是什么? ·合作伙伴关系对图书馆及其所提供的服务产生了怎样的影响? 研究对丹麦研究型图书馆代表进行了10次访谈,对技术提供者进行了5次访谈,通过访谈得到的信息,该报告概述了丹麦当前研究型图书馆与图书馆技术提供者之间的合作伙伴关系特点。 研究结果表明,图书馆和技术提供者在如何看待其合作方面存在普遍差异。报告也反映了在更广泛的欧洲研究型图书馆领域的相关情况和挑战。 该报告将为DFFU和LIBER成员未来合作伙伴关系发展提供指导,报告内容,见http://www.chinalibs.net/ArticleInfo.aspx?id=570878&cb=qinyue。

    发布时间: 2024-07-26

  • 79. 中国人工智能智库影响力评价
    闫亚飞
    随着新一轮人工智能浪潮兴起,国内快速涌现出一批服务于人工智能发展的智库,探讨此类智库影响力状况,旨在助力该领域智库发展和智库服务能力提升。[研究方法]基于5W传播模型、创新扩散理论和信息生态理论等,从理论层面确定了影响主体、影响信息、影响渠道、影响对象和外部环境五大智库影响力要素。据此,构建了以决策影响力、学术影响力、社会影响力和国际影响力为一级指标,包含9个二级指标,18个三级指标的指标体系。然后,对26家样本智库的综合影响力和各层次影响力开展评价。[研究结论]我国已经发展起一支体量相当的人工智能智库队伍,可大致划分为4个梯队,队伍整体结构呈现中间大、两头小的特征。各梯队智库的国际影响力均有待提升,第二梯队智库需重点加快提升决策支撑能力和质量,学术研究能力,以及服务社会的意识和能力。第三梯队智库特别需要拓展咨政渠道。第四梯队智库各层次影响力均有较大提升空间。

    发布时间: 2023-10-10

  • 80. 数智时代的人工智能素养:内涵、框架与实施路径
    程冰
    数字化和智能化的背景下,AI素养的出现对长期从事素养教育的高校图书馆提出了新的要求。本文系统梳理国内外AI素养研究进展,从AI素养内涵、框架和实施路径方面展开全面探讨,以期为高校图书馆开展人工智能素养教育提供指导和借鉴。研究认为AI素养的出现起源于素养概念的进化和人工智能的催化。AI素养不仅是对技术的理解和应用,更是一种全面的、与时俱进的技能和知识体系,更应该将关注的视角转向AI素养对普通大众的重要性。研究通过引入KSAVE模型构建AI素养框架,覆盖知识、技能、态度、伦理、价值观五个关键领域。在此理论基础上,论述高校图书馆参与AI素养教育的合理性和必要性。通过辨析信息素养、数字素养、AI素养的异同,提出高校图书馆AI素养教育实施路径。建议从跨学科知识体系构建、能力构建与实践应用、道德觉醒与责任担当三个方面开展AI素养教育,为培养未来社会的责任感强、具有批判性思维的AI素养人才奠定坚实基础。

    发布时间: 2024-07-26

  • 81. 评估学术图书馆的 AI 素养:一项以美国员工为重点的调查研究
    徐宏帅
    评估学术图书馆的 AI 素养:一项以美国员工为重点的调查研究 2024年1月1日, 新墨西哥大Leo S. Lo发布了一篇论文名为《评估学术图书馆的人工智能素养:一项以美国员工为重点的调查研究》。 这项研究调查了学术图书馆员工的人工智能素养(主要在美国),共有760名受访者。调查结果显示,人们对人工智能概念的理解程度一般,对人工智能工具的实际操作经验有限,在讨论伦理影响和人工智能项目合作方面存在明显差距。受访者强调需要进行全面培训及制定道德准则。该研究提出了一个框架,定义了为图书馆量身定制的人工智能素养的核心组成部分。随着图书馆越来越多地将人工智能整合到其服务和运营中,研究结果为指导专业发展和政策制定提供了相关见解 上图展示了受访者对生成式人工智能的理解。结果表明,虽然图书馆员已经开始了解人工智能及其潜力,但仍有很大的增长空间。 在对人工智能工具的熟悉程度方面,大多数受访者的熟悉程度达到中等水平(30.94%)。只有少数受访者对这些工具的熟悉程度很高(3.87%),这表明有机会对这些工具设置更多的培训。 研究人工智能在图书馆行业的普及程度时,研究人员发现了一个新的现象。一些技术得到了广泛应用,而另一些技术则相对冷门。聊天机器人和文本、数据挖掘工具是使用最广泛的人工智能技术。 受访者对特定人工智能概念的理解也遵循了类似的趋势。更直接的概念,如机器学习和自然语言处理,更易被人理解,而复杂的领域,如深度学习和生成对抗网络,则不太了解。这一趋势强调了在图书馆设置有针对性的人工智能教育项目的必要性。 关于以人工智能为重点的专业发展的思考,有以下几个关键主题: 培训模式:图书馆员通过各种形式参加培训,包括在线研讨会、线下研讨会和自学。在线选项很受欢迎,为不同的专业人士提供了可访问性; 人工智能工具和应用:培训课程主要介绍ChatGPT及其他应用,重点是在学术上的应用;伦理影响:会议经常讨论伦理问题,如偏见和隐私,以及“黑匣子”人工智能模型的潜在滥用; 融入图书馆员工作流程:项目探索人工智能融入图书馆工作,包括教学、编目和引文分析; 人工智能素养:人们反复关注理解和教授人工智能概念,这与更广泛的信息素养讨论有关; 人工智能培训:培训包括在图书馆教学中使用人工智能工具,并了解其对学术诚信的影响; 实践社区:提出了一种共同理解人工智能挑战和机遇的方法; 自主学习:部分图书馆员积极寻求自主学习机会,体现了对人工智能专业发展的积极态度。 研究结果强调了人工智能在图书馆中的多面性,强调了持续、全面专业发展的必要性。这包括解决技术和道德方面的问题,为图书馆员提供实用的人工智能技能,并建立一个支持性的实践社区。 如上图所示,人们普遍认识到解决与人工智能使用相关的道德和隐私问题的紧迫性。74.34%的受访者(包括“同意”和“非常同意”)强调了迫切需要解决与人工智能相关的潜在道德和隐私问题,强调了图书馆员在人工智能时代保持服务完整性方面的责任。 这些定性回答提供了图书馆专业人员对生成式人工智能的看法以及他们对图书馆行业影响的丰富理解。这些回答被归类为以下几个关键主题。 道德及私隐问题:受访者对潜在的数据滥用和侵犯隐私表示担忧; 教育和培训的需要:对图书馆员进行人工智能教育和培训的需求是一个普遍话题。受访者强调了在实施人工智能工具之前理解它们的重要性; 滥用的可能性:受访者对滥用人工智能工具的可能性表示担忧,例如产生虚假引用或过度依赖人工智能系统。他们强调了批判性思维技能的重要性,并告诫不要用人工智能取代人类的判断和学习过程; 对可行性的担忧:一些受访者对图书馆快速有效地实施人工智能工具的能力表示怀疑。人工智能工具的频繁更新和改进、需要大量投资以及人工智能的使用方式可能对图书馆或其用户无益; 人工智能在图书馆中的作用:一些受访者提出了人工智能可以在图书馆中使用的具体方式,例如用于馆藏开发、指导和回答常见问题。然而,他们也提醒不要将人工智能视为解决所有图书馆难题的灵丹妙药; 人工智能对职业影响的担忧:一些受访者表示担心人工智能的使用可能会导致工作岗位的流失或人工的贬值。他们建议,人工智能应该用来补充,而不是取代图书馆员; 批判性评估的必要性:受访者强调需要对人工智能工具进行批判性评估,包括了解其局限性和潜在的偏见。他们建议,图书馆不应该在完全理解人工智能的含义之前就急于实施人工智能; 人工智能素养:一些受访者认为,图书馆在向学生和其他图书馆用户教授人工智能素养方面可以发挥作用。他们强调了理解人工智能工具如何工作以及如何负责任地使用它们的重要性。 图书馆员对生成式人工智能的看法是多方面的,包括这些技术的潜在益处和挑战。虽然人们认识到人工智能在增强图书馆服务方面的潜力,但也非常强调道德考虑、教育和培训、批判性评估以及负责任地使用这些工具的必要性。这对图书馆行业的影响是重大的,涉及到工作替代,对新技能和新角色的需求,以及图书馆实践和服务的潜在变化。这些发现强调了在图书馆中使用生成式人工智能研究的必要性。 结论 虽然图书馆已经认可了人工智能工具的优势,但对这些技术的全面理解和准备仍然不够理想。这一现实凸显出迫切需要投资于针对性的教育战略和持续专业发展措施。 重要的是,在人工智能素养、对人工智能概念的理解以及对人工智能工具的实际熟悉程度方面,图书馆专业人员存在着巨大差异,因此有必要分层次量身定制人工智能的教育方法。未来的培训计划目标应超越知识获取,使图书馆专业人员具备有效、道德和负责任地运用人工智能技术的能力。在图书馆采用人工智能技术时,道德和隐私问题成为重要考虑因素。 该研究表明人们对人工智能潜力的理解与有效利用它的能力之间存在脱节。这就需要对潜在的障碍进行更深入的调查,包括技术熟练程度、资源分配和制度文化等。 该研究提出了一个定义学术图书馆人工智能素养的框架,其中包含七项关键能力: 理解人工智能的能力和局限性:认识到人工智能能做什么和不能做什么,了解它的优势和劣势; 识别和评估人工智能用例:发现和评估图书馆中潜在的人工智能应用程序; 有效和适当地利用人工智能工具:在图书馆运营中应用人工智能技术; 批判性地评估人工智能的质量、偏见和道德:评估人工智能的准确性、公平性和道德; 参与知情的人工智能讨论与合作:以知情的方式参与涉及人工智能的对话与合作; 识别数据隐私和安全问题:理解和解决与人工智能系统中数据保护和安全相关的问题; 预测人工智能对图书馆利益相关者的影响:为人工智能将如何影响图书馆用户和员工做好准备。 根据目前研究的发现和局限性,以下是对未来研究的建议: 纵向研究:该研究提供了学术图书馆员工在特定时间点的人工智能素养情况。未来的研究可以开展纵向研究,跟踪人工智能素养随时间的变化,从而深入了解干预措施的有效性以及图书馆行业人工智能素养的演变; 比较研究:该研究侧重于学术图书馆员工。未来的研究可以开展比较研究,考察不同类型图书馆员工(如公共图书馆员工、学校图书馆员工)或不同国家图书馆员工的人工智能素养。这些研究可以帮助我们深入了解影响人工智能素养的因素以及在不同情况下行之有效的策略; 干预研究:这项研究确定了人工智能教育和培训的必要性。未来的研究可以设计和评估旨在提高图书馆员工人工智能素养的干预措施。这些研究可以为培训项目和资源的开发提供建议; 伦理考虑:这项研究强调了在图书馆中使用人工智能的伦理问题。未来的研究可以更深入地研究这些伦理问题,检查不同利益相关者(例如,图书馆用户,图书馆管理员)的观点,并探索解决这些问题的策略; 人工智能对图书馆服务的影响:该研究探讨了图书馆员工对人工智能在图书馆服务方面潜在影响的看法。未来的研究可以考察人工智能对图书馆服务的实际影响,评估人工智能在增强用户体验、简化操作和支持学习方面的有效性。

    发布时间: 2024-04-29

  • 82. 《2024年EDUCAUSE地平线报告(教学版)》要点与启示
    程冰
    美国高等教育信息化协会(EDUCAUSE)最近发布的《2024年地平线报告(教学版)》,已成为各国政府预测和研判未来高等教育教学高质量发展的重要参考,分析报告内容有助于为我国高等教育数字化转型和高质量发展制定前瞻性战略规划。报告首先采用改进的德尔菲法和“STEEP趋势框架”,从社会趋势、技术趋势、经济趋势、环境趋势、政治趋势和人工智能趋势等六个方面,描述了影响未来高等教育教学的20种宏观趋势;其次,报告详述了影响未来高等教育教学的6项关键技术实践;最后,报告预测了劳动力技能需求驱动的高等教育增长场景、数据收集限制的高等教育约束场景、政治浪潮影响的高等教育崩溃场景、个性化教育赋能的高等教育转型场景等4种未来发展场景。报告主要为我国高等教育教学未来创新发展提供了四个方面的启示:建立健全教育数据安全相关制度和标准,持续推动高等教育数字化转型;重塑人工智能赋能教学和学习的新形态,深化高等教育创新变革与发展;完善技术赋能高等教育保障和服务新体系,促进高等教育可持续性发展;持续加强高等教育师生专业发展培训,助力数智技术赋能新质人才培养。

    发布时间: 2024-07-26

  • 83. 温雪梅:城市群政府数据共享的网络结构研究—— 以长三角区域为例
    黄雨馨
    城市群政府数据共享的网络结构研究 —— 以长三角区域为例 温雪梅 图书情报工作.2023 Vol.67 (10): 26-37. 摘要: [目的/意义] 在新一代信息技术革命背景下,针对城市群政府数据共享的选择性行为及其关系结构特征进行讨论分析。[方法/过程] 主要以政府间互动关系为出发点,运用社会网络分析方法对长三角区域的跨地区和跨部门数据共享网络结构进行量化剖析。[结果/结论] 当前我国城市群数据共享网络水平较低、结构有待优化;城市群数据共享网络的形成以强制性推动为主,但演化出自组织类网络;数据性质和原有政府间关系对城市群中相关政府主体行为选择具有重要影响。因此,提出要加强自组织型网络的培育、增强政策协同性和数据治理改革系统性等政策建议。

    发布时间: 2023-10-10

  • 84. 【动态】数字时代,“一稿多投”禁令会不会松动 学者呼吁优化学术期刊出版流程
    于彰淇
    一直以来,学者们向学术期刊投稿面临着激烈竞争,特别是影响因子较高的期刊,发稿更是“一刊难求”。作者常会遇到等待好几个月最后还被拒稿的情况。由于有着“一稿多投”禁令的约束,大部分学者只能等待。 但也有不同的声音。前不久,《自然》就发表了葡萄牙学者德里琼·格鲁达(Dritjon Gruda)的文章。他提出,“一稿多投”不仅延误了科研工作的进程,还阻碍了科学信息的快速传播。在数字时代,应该废除期刊禁止“一稿多投”的规则。该文章将学术圈里的禁忌搬上台面,引发的有共鸣有反对,还有在数字时代更好地看待“一稿多投”问题、促进学术发展的思考。 著作者和期刊之间的不同诉求格鲁达在文章中提出,“一稿多投”的禁令最早要追溯到前数字时代。在那个时代,信息交流不畅,版权规则难以执行,主要由期刊编辑对纸质稿件进行筛选,同行评议人也很少。 于是,为了规范出版流程和保护原创性,期刊社开始要求研究人员一次只能向一个学术期刊提交其研究论文,不能同时向多个期刊提交相同的论文,以此维护审稿过程的公正与透明,保护编辑和作者的共同权益。 《中国肿瘤临床》与Cancer Biology & Medicine(《癌症生物学与医学》)编辑部主任刘惠琴认为,“一稿多投”禁令的产生,是为了避免稀缺出版资源的浪费,保障正常的出版秩序。 “‘一稿多投’伴随重复发表风险。这也就意味着会牵扯到版权问题,引起版权纠纷。‘一稿多投’还会让多家期刊耗费时间和金钱对同一篇论文做重复性工作。此外,在当前审稿人资源紧张的情况下,审稿人可能为多个期刊服务,‘一稿多投’容易导致审稿混乱。”刘惠琴举例说,一篇稿件在确定发表之前,一般要经历编辑初审、同行评审、编委会终审的审稿流程。有的文章就曾在同行评审的环节,被审稿专家发现在为其他期刊审稿时看到过,这意味着期刊之前所做的工作可能是“无用功”。 因此,目前绝大多数期刊社都明确拒绝“一稿多投”。“我们会在作者投稿时,让作者承诺稿件无‘一稿多投’的情况。一旦发现作者存在‘一稿多投’的问题,期刊社一般会做退稿处理,并将其列入失信作者名单。”刘惠琴说。 尽管禁令严格,但是“一稿多投”现象在学术圈依然存在。 对此,天津大学期刊中心主任陈金龙分析:“如果单纯从科研工作者角度来看,之所以有人会选择‘一稿多投’,还是希望能‘广撒网,多敛鱼,择优而从之’,也就是提高投稿命中率,加快科研成果公之于众的速度。”因为快速发稿能为著作者赢得相应的声誉。 “‘一稿多投’禁令的废与留之争,其实也是期刊社和作者站在各自立场的不同诉求的反映。”陈金龙表示。 数字技术可提高出版效率格鲁达认为,当科学出版进入数字化时代后,已经使评审工作实现了自动化。编辑和审稿人随时随地都可以审阅稿件,第一时间确定版权也更容易、更直接,效率大大提高。 在格鲁达看来,数字化的快速发展为“一稿多投”提供了可行性,这也更凸显了“一稿多投”禁令的不合时宜。他认为,“一稿多投”禁令不仅耽误科研创新的进程,还阻碍了科学传播的速度——尤其是在气候科学、健康和医学等许多领域。禁止“一稿多投”对年轻科研人员尤其不利。对他们来说,延迟发表不仅令人沮丧,而且影响晋升,会阻碍职业发展。 数字化技术的发展,真的可以解决“一稿多投”带来的问题吗? “虽然数字化时代,出版流程中的一些环节可以得到优化,效率可以提高,但是版权等问题依然无法解决。”陈金龙说,因为目前各个出版社的投稿平台都是独立的,并没有一个统一的投稿平台。大家在处理稿件的时候依然都是“背对背”,在出版之前无法看到其他平台的文章。如果多个期刊同时进行出版流程,一稿多发的风险依然存在。 对于著作者最为诟病的等候发稿时间过长等问题,刘惠琴认为,这也并非都是禁止“一稿多投”造成的。目前审稿专家资源十分紧张,特别是对于一些比较冷门的研究方向,审稿专家更是少之又少。即使在目前数字时代,期刊社可以在网络平台向审稿专家发送审稿邀请,但不能保证有专家应答。“我们就曾遇到过一个著作者,投稿给国外期刊,等了5个月,论文最终被退稿。主要原因就是没有找到合适的审稿人。”刘惠琴说。 探索有组织的“一稿多投”抛开“一稿多投”禁令的废与留之争,格鲁达也认为,发文章的真正目的是分享研究成果,促进学术交流。因此,他也给出了在“一稿多投”禁令下,可使论文尽快发表的建议。比如在正式投稿之前先与期刊编辑建立初步的联系,评估他们对论文的兴趣程度;根据文章的内容确定一个目标期刊列表,根据期刊的影响力进行分级,这样当文章被拒绝后就可以迅速转移到下一个期刊;投稿后,要定期与期刊进行沟通等。 同时,投稿人可充分运用数字时代的技术手段,比如通过网络等渠道了解期刊的审稿时间、出版周期和接收率等;可以通过预印本服务器提前上传手稿,将其作为工作的公开记录。 对此,刘惠琴表示认同。她介绍,目前期刊社正在积极推出各种举措,提升著作者论文发表速度。“我们会定期开展针对著作者的论文写作与投稿培训,让著作者更加了解不同期刊的特点和投稿要求。这使著作者在投稿时有的放矢,大大提升投稿的命中率和发表效率。”刘惠琴说。 陈金龙也表示,为了保证重要科研成果的时效性,目前很多期刊社开辟绿色通道等形式,加快重要领域科研文章的评审速度。 一些出版社和期刊社也在积极探索有组织的“一稿多投”。今年9月,细胞(Cell)出版社宣布推出“一稿多投”服务,允许作者将研究论文提交至生命与健康科学领域的期刊,以及一些与细胞出版社合作的学会期刊。 陈金龙认为,这种方式相当于把论文投给同一个出版社旗下的多个子刊。通过期刊矩阵,可以实现资源共享,避免出现版权纠纷。 “国内的出版社虽然无法达到国外这么大的规模,但我们可以采用联盟的形式。”刘惠琴介绍,其与相同领域的期刊成立联盟,联盟成员之间可进行文章和评审专家的资源共享,未来可能会实现联盟内部期刊之间的“一稿多投”。

    发布时间: 2024-01-19

  • 85. 高校学生人工智能素养能力现状及影响因素多维分析
    程冰
    [目的/意义] 深入研究大学生AI素养能力现状以及其与实际应用、态度、兴趣等因素之间的关系,探讨高校在AI时代培养学生拥有良好AI素养的可行性与举措,为推动AI素养教育提供实证支持和理论指导。 [研究设计/方法]采用定量研究方法,通过调查和数据分析,分析了高校学生的AI素养水平现状以及其与教育培训背景、实际应用经验、态度和兴趣之间的相关性。研究设计强调实践性经验对于提高学生AI素养水平的关键性作用,并多角度考察了教育培训、学科背景、态度、兴趣等因素对AI素养的影响。 [结论/发现]在数字化时代,实践性经验对于提高高校学生的AI素养水平至关重要。通过实际使用AI技术或产品,学生更容易将理论知识转化为实际技能,全面提升其在AI素养方面的水平。此外,学生的积极态度、兴趣与AI素养之间呈正相关性关系。 [创新/价值]为高校学生AI素养水平测量提供了有针对性的量表,并验证了影响AI素养水平高低的因素。为未来深入探讨AI实际使用与理论学习之间关系、设计有针对性的教育培训框架提供了基础。 引自: 郭亚军,冯思倩,寇旭颍,等.生成式AI背景下的图书馆员:角色、技能与进路[J].图书情报工作,2024,68(13):69-77.DOI:10.13266/j.issn.0252-3116.2024.13.006.

    发布时间: 2024-07-26

  • 86. 智慧数据驱动的古籍智慧性保护体系研究
    黄雨馨
    智慧数据驱动的古籍智慧性保护体系研究 陈涛,苏日娜,张永娟,张靖,余厚强 古籍承载着中华民族的共同记忆,对古籍进行保护、数字化、活化利用,就是延续中华民族的文化命脉。近几年,智慧数据的兴起给古籍保护提供了新的研究和实践视角。本文梳理总结现有的智慧数据研究成果,指出智慧数据是一个定性的概念,是一个流变的过程,是一个多态的结果;提出智慧数据产生的技术路径,将其划分为语义数据、关联数据、智能数据和智慧数据四大数据形态;在智慧数据的驱动下,提出古籍智慧性保护体系框架,从数据的角度、知识的维度和智慧的深度整体构建古籍知识谱系。智慧性保护丰富了古籍数字化的研究范畴和保护方法,贯彻了文化遗产保护发展理念,推动了古籍活化利用的实现进程,并迎合了科技发展的趋势。正如智慧没有边界,智慧性保护的内容和范畴也不会固定,会随着技术的进步而不断得到完善,未来智慧性保护将会得到更多的认可和关注。

    发布时间: 2023-10-10

  • 87. 欧洲大学协会2024年趋势报告
    程冰
    7月25日,欧洲大学协会(European University Association,简称EUA)发布《2024年趋势报告》。该报告反映了欧洲高等教育区(European Higher Education Area ,简称EHEA)在疫情后面临的挑战与变革。报告强调,高等教育机构(Higher Education Institutions ,简称HEIs)需适应新的环境,并通过教育、研究和社会参与作出积极贡献。通过全面的调查,报告中指出了高等教育机构所面临的多样化优先事项和挑战。 变革时期的战略与改革 欧洲的重要性:超过98%的HEIs认为,欧盟的Erasmus+项目和Bologna进程至关重要。此外,其他主要倡议(如EEA、ERA、Horizon Europe、EUA)对89%或更多的HEIs同样重要。 国家改革:大多数机构报告,在过去五年,国家在高等教育改革取得显著进展,特别是在质量保障(69%)、数字化(68%)、国际化(67%)和机构资助(64%)等领域。 参与程度:仅有5%的HEIs表示完全不参与国家层面的战略与改革,许多机构至少在某种程度上得到了咨询。 影响因素:数字化、新冠疫情、机构间合作、环境可持续性和经济发展是过去五年影响机构战略的五大因素。 资金不足的威胁:44%的机构报告在过去五年中,资金持续低迷或减少,70%的HEIs认为资金不足是改善学习与教学的三大障碍之一。 疫情的长期影响:疫情对40%至66%的HEIs造成了持久性影响。 数字化准备:尽管数字化准备有所改善,但对人工智能和区块链的关注相对较少。72%的机构已制定环保与可持续发展战略。 基本价值观:大多数受访者认为,Bologna进程定义的基本价值观(如学术自由、学术诚信和机构自主性)基本稳定或有所改善,但19%的机构报告其自主权有所下降。 对受风险学者和学生的支持:多数机构已制定相关政策,近三分之二的EHEA接纳了来自乌的学生。 与俄罗斯和白俄罗斯的合作减少:战争导致大多数机构减少与这两个国家的合作,个别学者间的交流仍在继续。 高等教育使命 研究与教育的重要性:参与2024年趋势调查的大多数机构认为,研究与教育同等重要,并已采取具体措施将二者结合。 多重使命:除了教育和研究,机构还参与服务社会和国际化工作。 服务社会的优先级:超过三分之二的机构将服务社会视为战略优先事项,并预计未来相关活动将进一步增加。然而,资金不足和人员短缺是主要挑战。 教学支持:大多数机构提供教师培训和交流合作机会,约三分之二的机构设有学习与教学中心,以促进教学实践社区的发展。 教学评估与职业发展:大多数机构将教学绩效评估纳入职业发展评价指标。尽管学术界对教学和研究的重视程度有所提高,但许多机构仍认为教学在学术评估和职业晋升中占较小比例。 公平、多样性和包容性(Equity, Diversity And Inclusion,简称EDI):几乎所有高等教育机构将EDI视为主要优先事项,并制定相关策略。过去五年中,支持EDI的具体措施有所增加,但机构在资金方面面临困难。不同国家的EDI政策存在差异,使得评估和比较这些政策变得复杂。 高等教育机构的主要趋势 学生人数:大多数机构报告学生人数稳定或增加,但中部及东部的部分地区的本科和硕士生人数却在下降。 多样性:学生群体日益多样化,国际学生数量上升,机构普遍实施国际招生策略。 混合学习:学生和教职工对混合学习的需求持续上升,平均而言,欧洲高等教育区有 79% 的学生在校内学习,9% 的学生在校外学习,12% 的学生将两者结合起来学习。 灵活的学习方式:大多数学位授予机构在课程中提高了灵活性,尤其是在选修课的提供上,但较之2018年整体措施有所下降。 就业支持:几乎所有机构均有支持学生就业的措施,但与毕业生本身相比,高校对学生进入职场的准备情况过于乐观。 非学历教育的兴起 增长趋势:70%的高等教育机构目前提供非学历教育,另有21%计划提供。 微证书:微证书在欧洲和国家政策中占据核心地位,被视为创新与包容的机会。75%的机构将其视为多样化教育的战略之一。 实施挑战:约一半至三分之二的机构面临实施挑战,包括缺乏框架、定义学习者身份、资金模式及课程设计等问题。 不同看法:虽然大多数机构对微证书持积极态度,但也指出预测其有效性和影响为时尚早。各机构对外界对微证书的期待感到担忧,认为这些期望可能过高,特别是在一些法律、透明度和兼容性问题尚未解决的背景下。 MOOCs(在线课程)停滞:仅约四分之一的HEIs仍然提供MOOCs,其受欢迎程度似乎下降。 未来预期:一半的机构预计在未来五年内非学历教育的入学人数将增加,另有25%预计人数将保持稳定。 终身学习角色:非学历教育的日益参与,无论是在课程数量还是学习者数量方面,都促使我们反思其与学历教育的互补性,以及高等教育在终身学习中的角色。 国际交流与机构间合作 国际化:国际化仍然是欧洲高等教育机构的高度优先事项,受到欧洲政策改革、资金的支持。 流动性情况:大多数机构的流动率有所上升或保持稳定,但约一半的机构尚未恢复到疫情前的水平。流动的基准目标(20%)仍然遥不可及,机构认为需解决住宿和资金不足等问题。其中,81%的HEIs提到奖学金不足是主要障碍。 学分认可问题:45%的机构在学分认可方面存在问题,表明Bologna进程的改革尚未全面实施。 虚拟交流的兴起:新冠疫情使虚拟交流成为国际的主流形式,混合流动性(虚拟与实体结合)变得更为常见,虚拟交流的使用率从12%增至54%。 教职员工流动性:教职员工流动日益成为重要优先事项,57%的机构致力于改善相关策略,但仍缺乏系统性方法。 联合项目与学位:约一半的机构提供联合项目和学位。受欧洲大学倡议的推动,尽管实施面临着复杂挑战,但整体情况乐观。 系统化国际活动:72%的机构已建立系统化国际活动结构和资源,59%的机构设有专门领导职位,五分之一的机构面临人员资源不足。

    发布时间: 2024-10-31

  • 88. 学界对人工智能素养的概念的理解
    程冰
    人工智能技术应用快速渗入社会生产与日常生活,人工智能既赋能产学研提高生产力,又带来工作替代、数据隐私与安全、道德与伦理等等挑战。在人类与人工智能技术共存的时代,社会公众需要具备哪些素养以适应人工智能时代的发展成为迫切需要探讨的问题。施雨等学者对人工智能素养的概念做了文献回顾。 一种观点认为,人工智能素养与其他多种素养之间属于包含与被包含的关系。许亚峰等认为数字素养包含人工智能素养,个体适应人工智能时代学习、工作等行为活动时所需的能力即为人工智能素养。Cetindamar D等将AI素养定义为“四个核心能力”,包括技术相关能力、工作相关能力、人机相关能力和学习相关能力,这些能力均属于工具和数据素养范畴内。Yi Y认为人工智能素养包括功能素养(传统的读写能力)、社会素养(教育个体读懂社会的能力)和技术素养(学习时代必备的基础技术能力,涉及数字素养、媒体素养、ICT素养以及AI利用能力。 另一种观点认为人工智能素养是信息素养、数字素养等的延伸,与信息技术相关素养有交叉重叠,但存在差异。Long D等将人工智能素养定义为一组能力,使个人能够批判性地评估人工智能技术、与人工智能进行有效的交流与合作以及在多场所中使用人工智能工具;人工智能素养与其他信息技术素养有关联,数字素养是人工智能素养的先决条件,个体需要了解如何使用计算机来理解人工智能;计算素养、科学素养不是人工智能素养必需的先决条件;因数据素养与AI子领域(如机器学习)密切相关,某些数据素养与人工智能素养重叠。王欢认同此观点,提出人工智能素养是集人工智能知识、运用人工智能的能力与对待人工智能的智能意识为一体的综合素养。与其他信息技术素养重叠的表现还有各类素养概念中均提及的道德伦理。伦理是人工智能素养的关键因素。Wang B等提出人工智能素养是在符合道德标准下正确识别、使用和评估人工智能相关产品的能力。 信息来源:施雨,茆意宏.人工智能素养的概念、框架与教育[J/OL].图书馆论坛:1-12[2024-06-12 16:54].

    发布时间: 2024-07-26

  • 89. 2024年诺贝尔经济学奖揭晓,“引文桂冠奖”再次全部命中!
    程冰
    北京时间2024年10月14日下午,2024年诺贝尔经济学奖揭晓,曾于2022年荣获“引文桂冠奖”(Citation Laureates)的 Aron A?cemoglu、Simon Johnson 和 James A. Robinson 因在关于制度如何形成并影响经济繁荣研究领域的突出贡献而获奖。 至今,被誉为“诺奖风向标”的科睿唯安“引文桂冠奖”已经成功预测了 83 位诺奖得主,其中包含了今年生理学或医学奖、化学奖以及经济学奖的8位获奖人!他们分别是: Victor Ambros,2024年诺贝尔生理学或医学奖学奖得主,于2008年荣获“引文桂冠奖” Gary Ruvkun,2024年诺贝尔生理学或医学奖学奖得主,于2008年荣获“引文桂冠奖” David Baker,2024年诺贝尔化学奖得主,于2024年荣获“引文桂冠奖” Demis Hassabis,2024年诺贝尔化学奖得主,于2024年荣获“引文桂冠奖” John M. Jumper,2024年诺贝尔化学奖得主,于2024年荣获“引文桂冠奖” Daron Acemoglu,2024年诺贝尔经济学奖得主,于2022年荣获“引文桂冠奖” Simon Johnson,2024年诺贝尔经济学奖得主,于2022年荣获“引文桂冠奖” James A. Robinson,2024年诺贝尔经济学奖得主,于2022年荣获“引文桂冠奖” 2002年以来,科学信息研究所(ISI)的分析师们每年基于 Web of Science?核心合集的论文和引文数据,遴选诺贝尔奖所涉及的生理学或医学、物理学、化学及经济学领域中全球最具影响力的研究人员。 1970年以来,Web of Science?核心合集收录的约 6100 万篇论文中,只有 0.01% 被引用次数超过 2000 次。引文桂冠奖得主通常从这些论文作者中甄选产生。 根据以往的预测结果显示,这些获得“引文桂冠奖”的科学家很有可能在当年或未来若干年后获得诺贝尔奖。

    发布时间: 2024-10-31

  • 90. 【问题建议】南京大学专家指出我国图书馆情报学科发展出现三方面新特点
    于彰淇
    【问题建议】南京大学专家指出我国图书馆情报学科发展出现三方面新特点 (本文根据《图书馆建设》4月9日刊载《21世纪前20年我国图情学科发展现状与国际影响力的比较研究》整理编写) 近日,南京大学教授、全国高校图书情报工作委员会期刊会副主任兼秘书长叶继元反映,随着我国经济、文化等的快速发展,各学科建设已有长足的进步,图书馆学情报学(以下简称图情学)也不例外。从我国图情学领域的英文发文量上看,目前仅次于美国,排名世界第二,但被引次数上相对较低,在质量及跨学科性丰富度上还存在不足。目前我国图情学科出现以下三方面发展特征。 一、我国图情学科研究规模不断扩大。21世纪初,我国图情学科发文量在国际上并不占优势,随着国家加大对科研的支持力度,我国图情学科发文量于2013年迎来了一场小爆发,发文增长率现已成为全球第一。虽然研究规模与美国的相比,差距仍然悬殊,但不可否认,我国已然成为全球图情学科的第二大研究体。 二、我国图情学科研究成果质量较高。虽然我国早期发文量较低,但篇均被引频次、CNCI指数都位列前排,篇均被引频次更是多次获得第一。可见,从一个侧面我国图情学科研究成果的影响力或质量有所提高。 三、我国图情学科研究内容不断丰富。从引文涉及学科数量来判断各国图情领域跨学科性的丰富度,美国保持明显优势,英国、中国、加拿大三国差距不大,西班牙仅涉及57中学科,位列最末。五个国家涉及的主要学科类别差别不大,主要为计算机科学、管理学、心理学、大众传媒、医学、运筹学与管理学等。其中,我国图情学科与医学的交叉研究明显低于其他四国,与地理学的合作是我国图情跨学科研究的一大特点。 对此,建议: (一)聚焦高被引文献数量。从21世纪初期到2019年成为世界图情学科发表英文论文量第二的国家,我国图情学科的研究规模发展显著。近年来发文量增长速度位居世界第一,与美国还有明显差距,但已和其他国家拉开差距。学科发展仅仅依靠少数人的努力是远远不够的,在加大对图情学科的投入,加强学者间的沟通,促进产出的同时,还需要鼓励更多有兴趣的学者加入,为我国图情学科研究规模的不断壮大添砖加瓦。研究规模扩大的同时也不能放松对质量的监管,要平稳迈步,切不可片面追求数量,成为“前进的瘸子”。虽然数据显示我国图情情报学领域研究成果篇均被引频次高,在国际上也受到认可,但从高被引文献数量的角度出发,我国文献占比并未表现出明显的优势,数量上远低于美国,反映出我国图书情报学领域的高质量文献数在国际上占比不足的问题。因此,我国图情学科应该在研究规模不断扩大的同时,持续关注高质量文献的输出,提高高被引文献的数量,争取在国际图情领域中获得更多的话语权,提高我国图情学科在的国际地位。本文认为,发出中国声音,讲好中国故事,争取国际话语权不仅可以通过在外文期刊上发表文献获得,还可以通过提高本国期刊刊文质量,将更多的中文期刊推上国际舞台,使我国图情学科的研究成果受到更广泛的关注。这也要求我国学者不能一味追求在外文期刊上发表论文,而忽视国内高水平期刊。 (二)打造跨学科特色品牌,多方位合作交流。首先,打造特色品牌,做到“人无我有,人有我优”,毫无疑问能提高一个学科的专业性与竞争性的方法之一。跨学科研究中发现,我国图情学科与地理学的交叉研究明显多于其他四个国家,利用好这一跨学科性特征,加强与地理学的联系合作,形成强势跨学科研究领域,有利于扩大我国图情学科在国际上的影响力。其次,要注意加强与其他学科的合作,学科间的交流互动不仅能为学科发展提供动力,还能促进其不断创新,形成发展的良性循环。我国图情学科交叉研究的丰富性亟待提高,与医学方面的研究目前还有很大发展空间。随着我国这次新冠疫情防治取得了阶段性胜利,国家高层已将人民健康和生命放在优先发展战略地位,医学与图情学的研究项目和经费会越来越多,其发展前景大好,是未来跨学科研究的一大发展方向。因此,加强与医学、药学等学科的联系,不仅能促进图情学科不断向前发展,还能从图情学科的视角发现新观点、新现象。

    发布时间: 2023-12-01

  • 91. 美国国立卫生研究院的医学科技创新资助政策演变及其启示
    程冰
    1、引言 一些发达国家的政府科研资助体系经过了相当长的发展阶段,对其资助政策和实践经验进行深入研究可能会带来启发。例如,美国国立卫生研究院(National Institutes of Health,NIH)是世界上最大的生物医学研究及资助机构,是美国生命健康领域最重要的政府科研资助部门之一,战略意义显著。 本文从历史变迁视角,剖析NIH医学科技创新资助政策实践与演变特征,特别是在资助高风险高回报、原创性、颠覆性医学科技创新方面的举措,借鉴并反思NIH资助相关理念和实践经验,为我国构建良好医学科技创新生态、激发科技创新活力提供启示。 2、NIH医学科技创新资助政策实践与演变特征 2.1  二战后形成的NIH二级评审制度根植于美国医学科技创新资助政策 2.2  20世纪80年代NIH种子基金激发美国医学科技创新成果转化活力 2.3  21世纪初期NIH创建共同基金模式顺应高风险高回报、跨学科研究需求 2.4  NIH路线图背景下临床与转化研究计划推进美国转化医学的发展 2.5  21世纪NIH资助体系不断改革为美国医学原始创新开辟资助渠道 2.6  生物经济时代美国设立ARPA-H模式以加速生物医学变革性研究与颠覆性创新 3 、对我国医学科研资助体系的启示与思考 3.1  探索建立公众参与的医学科研资助体系,并强调科研工作者的科学传播责任 3.2  完善同行评审系统,开拓非共识性项目评审机制 3.3  建立多种科技成果转化与临床专项基金体系,有效衔接医学基础、临床与应用 3.4  建立适宜的非竞争性资助机制,推动创新科技布局与人才培养 4、结语

    发布时间: 2024-10-31

  • 92. 人工智能治理的历史经验借鉴
    程冰
    随着人工智能这一新兴技术的快速发展,全球范围内的相关讨论也日益热烈。本文选择了卡内基国际和平基金会和兰德公司的两篇智库文章,从其他相似技术发展领域,如技术、互联网、加密产品和基因工程的治理历史路径入手,分析其中的成功经验,为人工智能治理提供更多的思路。 卡内基国际和平基金会:将人工智能讨论引入高级别核对话的风险 首先,作者陈述了上个月核政策制定者和专家为审查《不扩散核武器条约》执行情况的重要会议所做的准备。其次,作者进一步指出,在外交层面将AI注入核政策讨论可能存在潜在陷阱,引入AI的复杂性可能会分散对其他关键核政策问题的注意力,甚至可能以一种进一步加深外交障碍的方式与未解决的分歧领域联系起来。在论坛选择方面,虽然理论上利用AI讨论来克服其他外交障碍非常吸引人,但它引发了一些实际问题;在话题选择方面,增强讨论内容的具体性将会提高新论坛的生产力;在参与者方面,尽管一些核政策专家和外交官可能对AI有深入的了解,但这并不是参加核安全论坛的先决条件。此外,作者指出,鉴于AI和核武器交汇处的无数风险,这两个问题的交汇点当然值得在某些国际论坛上进行深思熟虑的讨论。 兰德公司:核技术等技术治理经验为人工智能治理路径提供了“他山之石” 首先,作者强调了人工智能(Artificial Intelligence, AI)治理具有紧迫性,多方利益相关者愈加关注人工智能潜在福祉和风险治理。其次,作者为了更好地制定AI治理地方案,分别梳理了核技术、互联网、加密产品和基因工程所对应的治理路径。就核技术而言,对于核技术扩散的担忧是推动核技术的治理机制演变的动力;就互联网治理而言,其采用了由私营部门主导、公私部门相互合作的治理模式,政府为治理提供资金并促进技术的发展,而私营部门则为治理的具体实践者;就加密产品而言,其代表了学术界和私营部门与国家和公共部门由达成共识到分歧凸显的负面治理案例,加密产品的治理模式经历了由公私部门达成共同规范到规范分异的历程;就基因工程而言,其采用的以私营部门和社会部门为主体、通过设置和开展国际会议,并创造性的发展“暂停”措施的治理模式被广泛视为在面对不确定风险时成功的技术治理案例。第三,作者指出了这四种新兴技术与AI的相似之处,并指出最有效的AI治理方法将取决于未来的特征。最后,作者根据人工智能治理可能出现的三类场境提出治理建议。

    发布时间: 2024-10-31

  • 93. 科睿唯安与中国科学院联合发布《2023研究前沿》,揭示全球热点和新兴前沿研究
    杨小芳
    2023年11月28日 —— 科睿唯安与中国科学院今天联合发布《2023研究前沿》报告,遴选和展示自然科学和社会科学的11大学科领域中的热点前沿和新兴前沿。今年是双方连续第10年携手发布《研究前沿》系列报告。 今年的报告遴选出128个研究前沿,包括110 个热点前沿和18个新兴前沿。报告为科研管理者和政策制定者提供了全球科研的最新进展和动态,帮助他们以有限的资源来支持和推进科学进步。 在《研究前沿》报告中,定义一个被称作研究前沿的专业领域的方法,源自于科学研究之间存在的某种特定的共性。这种共性可能来自于实验数据,也可能来自于研究方法,或者概念和假设,并反映在研究人员在论文中引用其他同行的工作这一学术行为之中。通过持续跟踪全球最重要的科研和学术论文,研究分析论文被引用的模式和聚类,特别是成簇的高被引论文频繁地共同被引用的情况,可以发现研究前沿。当一簇高被引论文共同被引用的情形达到一定的活跃度和连贯性时,就形成一个研究前沿。《2023研究前沿》报告以文献计量学中的共被引分析方法为基础,基于科睿唯安的Essential Science Indicators? (ESI)数据库中的12922个研究前沿。 科睿唯安与中国科学院同时发布了《2023研究前沿热度指数》报告,评估了世界主要国家和地区在128个研究前沿中的研究活跃程度。 点击链接提交表格,可下载《2023研究前沿》和《2023研究前沿热度指数》中文报告。

    发布时间: 2023-12-01

  • 94. 共建AI4S基础设施(三):替代文献的数据库与知识库
    闫亚飞
    无论哪一个学科,文献对于科研工作都是必不可少的,它可以帮助科研人员了解前沿动态和最新成果,学习相关知识和技术,激发创新和灵感,验证理论和实验,同时也是促进学术交流的载体。然而,科研文献更新速度快,数量呈现出爆炸式的增长,如何有效地管理和利用海量的文献资源,成为了科研人员面临的一个迫切的问题。据美国国家科学基金会统计,科研人员花费在查找和消化科技资料上的时间需占全部科研时间的51%。 近年来信息技术的飞跃,带来了各种文献搜索引擎如 Google Scholar、CNKI ,学术社交网络 ResearchGate、Academia.edu 等平台可以帮助用户快速找到相关领域的专家和研究成果,EndNote、Zotero 等可以帮助用户管理学术文献,GPT问答式检索的出现翻开文献查找新篇章。即便如此,已有工具仍存在功能单一或不完善、难以与其他的软件或平台进行对接集成,操作方式不简便,需要学习教程等问题。 构建AI for Science基础设施的目标之一就是集中力量解决共性问题,文献是支撑各学科科研工作者研究决策的知识体系,为提升创新效能,有机地将科学家们的集体智慧充分提取出来,构建易用性强、准确率高的替代文献的数据库与知识库,成为AI for Science基础设施建设方向之一。 对于自然科学研究来说,虽然GPT的出现在一定程度上增加了文献查阅的便捷性,但不完全适用于学术性问答的交互,存在局限性。科学文献大多为非结构化数据,且专业属性极强,各个领域的文献更新速度快。由于大模型的结构特点,每一次重新训练的成本都是非常高昂的,怎样让最新的数据高效的覆盖进来也是目前面临的重大问题。 将大语言模型与数据库相结合,可以通过对大量文本数据进行训练来生成语言模型,然后可以将这个模型与数据库结合使用,以便对数据库中的文本数据进行自然语言处理和语义分析。这种结合可以帮助提高数据库的查询和分析能力,从而更好地满足用户的需求。例如,可以使用大语言模型来自动化生成数据库查询语句,或者使用大语言模型来识别和提取数据库中的实体、关系和事件等信息,以便给用户更加智能化和个性化的查询分析服务。 类似这样的场景已经逐步实现:科研人员通过自然语言方式询问“我想知道最近一个月内被提及最多次的技术是什么”,“我想知道最近一个月内人工智能领域发表的论文中出现频率最高的技术是什么”,“删除最近一个月内指标低于 XX 的实验数据”,平台以对话形式返回结果或对数据进行相应操作,极大提高了数据管理的效率。 此外,还可以构建文献推荐系统,通过学习用户的历史行为和偏好,然后将这些信息用于预测用户可能需要关注的文献,并将这些预测结果与数据库中的数据进行匹配,从而提供用户最符合其需求的推荐结果。大语言模型结合向量数据库的方式,还可以加快大批量论文载入时间,降低数据的运算成本。 相较于传统检索方法只能返回精确匹配的文献本身,构建替代文献的知识库与平台工具,可实现多模态交互,并同时支持中英文提问回答方式,将为科研人员提供一个强大的知识信息资源和智能助手,轻松进行查找、阅读、对比分析、总结等需求。 科研数据不仅局限于文献文本,实验方法数据、结果数据、文献中的图表也是重要的数据来源。这也引发了构建实验方法知识库的需求。从海量的科学文献中自动抽取、整理、归纳和表示实验方法的相关信息,包括实验目的、原理、步骤、参数、结果、评价等,实现对实验方法的快速检索、比较、优化和推荐,以及对实验结果的自动分析、评估和总结。比如在合成化学领域,建立合成化学文献的附录,描述已有实验的步骤和结果。通过结构化查询,我们可以将其转化为合成化学实验知识库或数据库,开发人工智能算法进行对比分析,自动给出最佳合成化学路径的建议。利用知识库与实验仪器自动化系统进行对接,来实现对实验仪器的智能控制和调节,以适应不同的实验需求和条件,为实验自动化提供强有力的支撑。 未来,文献知识库最终的用户可能从现有的人类用户发展到机器用户,借助对话机器人辅助思考,让我们的提问也变得自动化。机器可以拆解我们提出的方向性问题,提出质疑点、设计论据,然后进行实验设计,再搜寻实验结论或者进行实验模拟,通过结果进行问题的反思推导或迭代实验设计方案,通过这样一套流程更进一步地提效,也打通了与另一个AI4S基础设施“高精度、高效率的实验系统”的连接。 不仅在自然科学,包括金融、资讯、法律在内的知识密集型产业都可以构建文献知识库,以提供强有力且通用性的支撑,让知识检索从面向数据库和检索工具,向下一个自然语言交互的对话时代发展。 相信,通过建设“替代文献的数据库与知识库”这一重要的AI for Science基础设施,将大大提升文献的检索、阅读、分析及管理效率,进一步助力科研人员提升科研生产力,让科研工作者释放更多的时间精力在解决关键问题与创新思考上。

    发布时间: 2023-10-10

  • 95. 文章荐读 | 数智驱动背景下产业竞争情报智慧服务的认知框架与实现逻辑
    黄雨馨
    数智驱动背景下产业竞争情报智慧服务的认知框架与实现逻辑 郑荣1,2, 王晓宇1, 高志豪1, 雷亚欣1 1.吉林大学商学与管理学院,长春 130012 2.吉林大学信息资源研究中心,长春 130012 摘要       探索数智驱动背景下产业竞争情报智慧服务的认知与实现等问题,有助于情报赋能产业健康有序发展。本文采用系统性文献综述与案例分析方法,按照“认识问题-分析问题-解决问题”的论证思维公式,从服务认识、服务分析、服务实现三个视角探讨产业竞争情报智慧服务的研究进展,概括并揭示产业竞争情报服务具有“服务技术智能交互化、服务模式问题导向化、服务环境积极生态化”的新特点。本文提出的“智能技术多维度融入、服务范式深层次转变、服务生态全方位重塑”的认知框架,以及“数据融合-知识挖掘-智慧服务”的实现逻辑,有助于拓展产业竞争情报服务理论,为服务实践提供了新思路。 关键词 产业竞争情报; 智慧服务; 数智驱动; 认知框架; 实现逻辑

    发布时间: 2023-10-10

  • 96. 从猿到人:探索知识服务的凤凰涅槃之路 --张晓林
    黄雨馨
    从猿到人:探索知识服务的凤凰涅槃之路 张晓林 DOI:10.11925/infotech.2096-3467.2023.0166 ChatGPT的横空出世,给所有以数据和信息为原料、以“知识”为产出的行业带来了如埃隆·马斯克所说的“存在主义焦虑”(Existential Angst)。而且,ChatGPT的持续迭代正以迅雷不及掩耳之势扑面而来,例如跨模态能力的GPT-4、ChatGPT和Whisper API接口开放、微软推出GPT-4 Office全家桶全面提升办公生产力。

    发布时间: 2023-10-10

  • 97. 评估人工智能素养计划以培养大学生的概念理解、素养、赋权和道德意识
    饶海侠
    新兴研究强调了在不同学术背景的受过教育的公民中培养人工智能(AI)素养的重要性。2023年1月,学者Kong在《Educational Technology & Society》期刊上发表《Evaluating an Artificial Intelligence Literacy Programme for Developing University Students’ Conceptual Understanding, Literacy, Empowerment and Ethical Awareness》一文。作者指出目前人工智能培训计划中应包含哪些内容以及如何教授人工智能素养内容仍待探索。为了填补这一空白,作者基于多维概念框架设计并评估了人工智能素养项目,该项目培养了参与者的概念理解、素养、赋权和道德意识。它强调概念构建,强调应用程序开发中的项目工作,并通过应用程序开发启动教学道德。36 名具有不同学术背景的大学生参加并完成了该课程,其中包括 7 小时的机器学习、9 小时的深度学习和 14 小时的应用程序开发。与项目工作一起,课程前后完成的测试、调查和反思性写作的结果表明,该计划成功地提高了参与者的概念理解、素养、赋权和道德意识。该计划将扩大至更多参与者,例如高中生和公众。这项研究开创了一条降低人工智能素养进入门槛的途径,并满足了公众的需求。它可以指导和启发未来的实证和设计研究,以培养不同背景的受过教育的公民的人工智能素养。 一、研究内容 本篇文章评估了人工智能素养扫盲计划对大学生的概念理解、素养、赋权和道德意识的影响。研究通过对课程参与者的自我反思文章进行分析,使用双语文本挖掘系统统计关键词的数量,以评估课程对参与者的影响。研究发现,该项目成功提升了参与者的概念理解和素养水平,并且通过项目工作赋予参与者更多的赋权感。此外,研究还强调了在应用开发中通过项目工作教授人工智能伦理的重要性。该研究对于培养广泛背景的受教育公民的人工智能素养具有重要意义,并为推动人工智能素养普及化做出了贡献。 二、研究结论 研究结果表明,课程参与者在AI相关概念的理解、素养和道德意识方面都有显著的进步。课程的项目作业使参与者能够应用他们的知识,获得实践经验,考虑道德问题,并培养他们的分析思维能力。参与者不仅考虑了课程中探讨的原则(自主性、善行/非恶行和公平性),还提到了课程以外的AI伦理要素,如透明度和隐私。此外,参与者还能够就人与AI的关系以及人类对AI引起的社会变革做出建议和思考。研究结果表明,将伦理考虑融入项目作业的教学方法是成功的,能够在真实场景中培养学生对AI的评估和反思能力。

    发布时间: 2024-10-31

  • 98. ChatGPT对图书情报的影响研究
    杨小芳
    摘要 这篇论文主要研究了OpenAI实验室推出的对话型语言模型ChatGPT对图书情报领域的影响,以及在应对人工智能技术挑战时应采取的措施。 方法 这篇论文提出了应对ChatGPT等人工智能技术的方法,以有效促进图书情报领域的发展和应用。具体措施包括: 1.加强对数据源的管理,确保数据的可靠性和准确性;  2.优化知识结构,构建更加全面、准确的知识图谱;  3.加强隐私保护,确保用户数据的安全性;  4.提高对人工智能技术的了解和应用能力,培养相关人才;  5.加强与其他领域的交叉合作,拓展应用场景。 结论 尽管ChatGPT在图书情报领域带来了机遇和挑战,但通过采取相应措施,可以有效促进图书情报领域的发展和应用。

    发布时间: 2023-12-01

  • 99. ChatGPT 生成虚假数据集以支持科学假设
    程冰
    2023年11月22日,nature新闻发表Miryam Naddaf的报道,ChatGPT背后的模型伪造了一个令人信服的虚假数据库,但法医检查表明,它并不符合真实性. 研究人员利用人工智能(AI)聊天机器人 ChatGPT 背后的技术,创建了一个假的临床试验数据集,以支持一个未经证实的科学说法。 为 ChatGPT 提供动力的人工智能模型可以创建表面上看似合理的科学数据集,作者将这些结果描述为“看似真实的数据库”。但是当专家检查时,这些数据没有通过真实性检查,并且包含了捏造的迹象。 在11月9日发表在《美国医学会杂志 · 眼科学》(JAMA Ophthalmology)上的一篇论文中,作者使用了ChatGPT4 与高级数据分析(Advanced Data Analysis,ADA)相结合,ADA 模型结合了编程语言 Python,可执行统计分析并创建数据可视化,AI 生成的数据比较了两种外科手术的结果,错误地指出一种治疗方法优于另一种。 EMBO Reports 主编 Bernd Pulverer 认为这是一个值得关注的问题。他表示,同行评议在现实中不会进行全面的数据再分析,也不可能发现利用人工智能精心设计的诚信缺失。”期刊将需要更新质量检查,以识别人工智能生成的合成数据。 以上编译报道如需转载请注明出处。

    发布时间: 2023-12-01

  • 100. 全球信息素养研究:文献计量学分析
    饶海侠
    了解信息素养的文献趋势可以为进一步的研究作准备。学者Shankar Reddy Kolle在《The Electronic Library》期刊上发表题为《Global research on information literacy: a bibliometric analysis from 2005 to 2014》的文章。该文章对信息素养(IL)领域2005 - 2014年间发表的文献进行计量分析,揭示了信息素养领域出版趋势。作者在Web of Science数据库上检索2005年至2014年收录的关于IL的文献,并使用文献计量方法来分析出版类型、分布情况、产出最多的作者和组织、以及最流行关键词等方面。研究发现,2005年到2014年间文献呈逐年上升的趋势,尤其在2007年、2008年和2011年迅猛增长;“Pinto, M”和“University of Granada, Spain”是最多产的作家和组织;《Journal of Academic Librarianship》是最多产的期刊,在此期间发表了97篇文章;美国是贡献最大的国家;“数字鸿沟”、“媒介素养”、“教育学”、“高等教育”和“批判性思维”是当前领域的研究热点。该文章能够帮助研究人员了解关于IL的文献趋势以及进一步研究的未来方向。 一、研究内容 该文章对2005 - 2014年在Web of science中检索的信息素养相关文章进行了文献计量学分析,详细分析了这十年内文章的出版类型和语言分布情况、年分布情况、产出最多的作者、机构和国家、产出最多的期刊以及被引次数最多的十篇文章及其关键词。 二、研究结论 信息素养相关文献数量从2005年(66篇文章)到2014年(2010篇文章)持续增长。2005年发表的文章每篇被引率最高(13.7次),而2014年发表的文章每篇被引率最低(0.4次)。自2005年以来,每篇论文引用的文献数也从32.5篇增加到2014年(40.7篇)。同时,平均每篇文章的作者数一直在下降,从2.2位下降到2009的1.7位,从2010年再开始逐年增长。西班牙格拉纳达大学的“Pinto, M”以23篇文章成为最多产的作者,在总文章、第一作者文章和通信作者文章中均排名第一。西班牙的格拉纳达大学是产出文章最多的机构,有28篇文章,在总文章(28篇)、机构间合作文章(19篇)和第一作者文章(21篇)中排名第一。美国发文排名第一。《Journal of Academic Librarianship》已经发表了97篇关于信息素养的文章,占Web of Science在2005-2014年期间检索的文章总数的6.5%。2014年,题为“理解网络可信度:评估网络信息和未来研究推荐的模型”的文章被引用次数最多,被引次数156次。“信息素养”是最流行的关键词,出现了350多次,其他两个流行词汇是“媒体素养”(150次),以及“数字素养”(120次)。另外,高校学生心理健康评价是心理健康研究的一个新领域。

    发布时间: 2024-01-19

相关报告