《场景化智慧数据驱动的情报研究模式:概念、技术框架和实验验证》

  • 来源专题:数智化图书情报
  • 编译者: 闫亚飞
  • 发布时间:2023-07-11
  • 情报研究是科技文献机构满足科技决策和服务需求、提供知识化服务的重要手段。随着科技决策和服务需求的深入,以及数据信息资源和技术的发展,情报研究先后经历了以文献、信息报道和资料翻译汇编为主的“文献搜集与资料整理服务”、以深入文献文本统计为主的“计量研究和检索服务”、以针对明确问题的基于大量资料的调研报告为主的“情报专题服务”、基于信息和技术的面向科技创新问题的“知识提供”等(如面向规划与布局的科技领域态势研判和机制体制分析等)发展阶段。不同历史阶段的情报研究具有其需求的合理性和历史的必然性,体现了不同时期的知识服务内涵与特点,这些情报研究类型至今在特定需求下仍在发挥重要作用。

    按照科研决策机构的要求,“情报服务要实现从数据到情报到知识到智慧的服务”和“智慧体现在可能的解决方案——Possible Solutions”。当前,国际科技竞争态势错综复杂,学科交叉融合、科研范式变革推动科技领域不断催生重大创新,ChatGPT等信息技术严重冲击传统知识服务,科技决策需要综合研判的因素更加多元,对数据和信息的需求更高。因此,情报研究在提供可能解决方案的知识服务中面临严峻的挑战:如何把握和解析“科技决策需求”本身?如何构建可循证的“数据+情报+知识”链与“科技决策需求”对齐?如何为“科技决策需求”“生成”“可能的解决方案”?

    文章针对当前“科技决策需求”的特点,提出场景化智慧数据驱动情报研究模式,建立科技决策需求场景(S)-场景化数据(DX)-解决方案场景(S)的量化表征模型(SDS),场景化分析视角贯穿SDS模型实现路径全链条。研究初步解决了“科技决策需求”本身的结构化可计算的描述(场景化),对齐“科技决策需求”结构化可计算的场景化数据(智慧数据)的挖掘与组织,以及在此基础上的可选解决方案的“生成”方法,并通过实例进行初步验证。

相关报告
  • 《数据与知识双驱动的知识组织系统构建框架研究》

    • 来源专题:数智化图书情报
    • 编译者:闫亚飞
    • 发布时间:2023-07-11
    •        知识组织系统(KOS)反映领域知识的概念及概念关系,是描述、表示特定领域的知识而生成的语义工具,涵盖了从简单的术语表到包含语义关系的规范档、受控词表、本体等。 知识组织系统的构建方式与计算机技术的发展相呼应。早期知识组织系统的构建主要依赖于专家先验知识,具有严格受控、权威性、全局性等优势。但纯粹依赖专家构建的知识组织系 统具有不可忽视的缺陷:一是主观性强,多依赖于专家先验知识,缺乏对终端用户需求的客观反映;二是实时性不强,知识组织系统构建后处于封闭静止状态,其无法通过自主学习进 行知识动态更新,术语经过长期实践积累达到一定规模后,才会由专家进一步更新,因此知识组织系统的概念更新缓慢,具有滞后性;三是成本较高,严格受控的概念选取及层次结构 建设使手工构建知识组织系统耗时耗力。大数据环境下实时更新的数据资源有待挖掘以提供各种智能化决策,其为知识组织系统提供了丰富的语料,自动构建知识组织系统成为可能, 通过对多源海量数据的自动采集、加工、处理、分析、整合和提炼,抽象形成具有一定结构的概念知识体系,但自动构建的方式依然有一定的局限性:一是机器语义理解差,从海量数 据中挖掘其结构,生成达到一定语义规范的概念存在困难;二是知识组织系统具有严格受控的多层次结构,机器学习技术仍难以自动化识别概念之间的丰富语义关系,建立语义关联且 形成符合用户需求的概念层级结构仍需人工干预;三是对数据质量要求高,自动化构建的知识组织系统高度依赖于所采集的涵盖主题领域的数据样本,数据的质量决定了最终形成概念 体系的质量。当前数据与知识相结合的第三代人工智能的出现,旨在将专家知识与海量数据有机结合,提升数据处理效率和质量。 如何借此契机,探索知识组织系统新的构建方式将成为当前知识组织领域的重要问题。         文章在分析国内外研究现状的基础上,从理论层面深度剖析数据和知识的协同机制,应用符 号学理论分析“数据”与“知识”之间的双向转换关系,并从知识组织系统的语法、语义、 语用角度,提出数据与知识双驱动的知识组织系统构建框架,有助于厘清数据与知识的双向转化,突破现有知识组织系统构建方法存在的局限,实现两种构建方法的深度融合及优势互 补,为数智时代自动构建高质量、高效率的知识组织系统提供新的路径。       知识分为隐性和显性两种类型。隐性知识是通过经验、行动、主观的洞察力等嵌入人类头脑中,难以正式表达、沟通或分享的知识;显式知识是可以正式表达、共享、复制、存储 的知识,更具有实用价值。知识管理中这两类知识通过相互转换而实现价值,但转换过程离不开数据支持。海量数据中蕴含着有待被挖掘的一定量的显隐性知识,经过分析、加工、 提炼等形成可表达的显性知识,服务于具体应用场景,进而产生新的数据,如此不断反复。如何从海量“数据”中获取、提炼、转换为有用的“知识”,“知识”又如何物化成可计算 的“数据”是实现数据与知识两者有效转换的关键。数据到知识的转化过程一直都是信息管理、信息系统、计算机领域等多个学科或领域关 注的热点话题。数据本身是观察的产物,存在于人类的思维之外,没有任何意义,定义为 表示对象、事件及环境的属性的符号。美国哲学家皮尔斯(Pierce)的符号学理论指出符 号由三个相互关联的基本要素组成:符号形体(Representamen)、对象(Object)和解释 项(Interpretant),其中符号形体可视为一种指代,对象是由符号所指的客观存在,解释项是人对符号与物体之间联系的理解和反应。由此看出,当认知主体对客观物理世界 进行感知时,从而为客观对象赋予了能够表征它的符号,即形成了多样化数据。而符号的含 义则是由主体所认知的知识来反映,此时知识成为提供符号意义的解释项,体现了对客观世界的理解和反映,使人们能够共享符号及符号语义以实现无障碍交流。知识由认知主体对客 观世界中数据(符号)的理解和反映而形成,通过对数据一系列组织和处理分析,形成对当前问题或活动的解释、理解及经验。数据密集型社会带来了数据量的激增,借助于统计学、 机器学习等技术,对海量数据进行提炼总结形成知识,数据到知识的转换效率提升。 知识向数据的转化是一个反向过程,当知识被语法、语义等结构描述后成为信息,信息被详细定义的数据结构规范后成为数据。数据是可被计算的符号,知识为数据符号提供 了语义解释。知识转化为数据就是将知识描述为可被计算的形式化结构,应用到数据处理环节中,以提升数据处理的效率。不断增加的知识同样面临序化表示的问题,知识组织系统作 为重要的工具,以知识为主要描述对象,对知识进行表示、描述、共享和使用,从而为符号所表达的语义意义提供明确的概念共识。正如 Qin Jian指出,知识组织系统实际上是将 人类对世界理解所形成的知识组织成各种系统或工具,以推动知识的再利用与创造。知识向数据转化过程需要各种知识组织系统的参与,通过对知识进行显性化、表示和存储,以更好 用以解释数据含义。 数据与知识的双向转化形成了一个联动的持续循环过程。依据波普尔“三 个世界”理论,上层表示物理世界,指代一切物质客体;中层表示精神世界;下层表示客观知识世界,凸显认知主体对客观世界中实体对象的感知和反映。物理世界产生了大规模的 实体对象,催生了用于指代实体对象的海量数据。数据作为认知主体给予对象的识别符号,数据的激增促进了认知主体对新的解释项的产生和扩充,进一步提升了对知识本身处理的需 求,推动知识组织系统的不断发展及应用。从海量数据中获取知识,以知识组织系统方式表示,并将知识组织系统应用到数据处理中,这样不仅推动数据与知识转换及增值,而且能够 动态反映外部客观世界变化,实现数据与知识从静态化向动态化管理。
  • 《文章荐读 | 数智驱动背景下产业竞争情报智慧服务的认知框架与实现逻辑》

    • 来源专题:数智化图书情报
    • 编译者:黄雨馨
    • 发布时间:2023-10-10
    • 数智驱动背景下产业竞争情报智慧服务的认知框架与实现逻辑 郑荣1,2, 王晓宇1, 高志豪1, 雷亚欣1 1.吉林大学商学与管理学院,长春 130012 2.吉林大学信息资源研究中心,长春 130012 摘要       探索数智驱动背景下产业竞争情报智慧服务的认知与实现等问题,有助于情报赋能产业健康有序发展。本文采用系统性文献综述与案例分析方法,按照“认识问题-分析问题-解决问题”的论证思维公式,从服务认识、服务分析、服务实现三个视角探讨产业竞争情报智慧服务的研究进展,概括并揭示产业竞争情报服务具有“服务技术智能交互化、服务模式问题导向化、服务环境积极生态化”的新特点。本文提出的“智能技术多维度融入、服务范式深层次转变、服务生态全方位重塑”的认知框架,以及“数据融合-知识挖掘-智慧服务”的实现逻辑,有助于拓展产业竞争情报服务理论,为服务实践提供了新思路。 关键词 产业竞争情报; 智慧服务; 数智驱动; 认知框架; 实现逻辑