《图情档学科嬗变的“第三次浪潮”:数据管理 -- 周文杰》

  • 来源专题:数智化图书情报
  • 编译者: 闫亚飞
  • 发布时间:2023-10-21
  • 一、 信息资源序化整理的三次嬗变

    1.文献层次的序化整理

    对图情档职业而言,图书、档案等文献资源是最基本的信息载体之一,文献资料的序化整理则成为图情档学科的内核。在传统图书馆学和档案学中,文献资料的序化整理主要是通过分类、编目和组织来实现的。分类是指按照一定的标准将文献资料划分成不同的类别,使得不同的文献资料能够被区分开来。编目则涉及到对文献资料的内容、主题、形式等进行分析和描述,为其分配唯一的标识符,并对文献资料的关键特征进行结构化、系统化, 从而达到对海量文献资源加以序化整理并提供高效率应用的目标。文献层次的序化组织主要指将分类和编目整合 起来,形成一个有序的索引体系,以便于查找和检索,不仅有助于提高文献资料的利用率和利用价值,同时,也有助于文献资料的长期保存和管理。

    2.信息层次的序化整理

    20 世纪以来,信息资源的数字化渐成主流,数字图书馆、电子档案和数据库在信息资源的整理序化中发挥了日益重要的作用。日新月异的信息技术发展使得数字化资源的序化组织变得更加高效和便捷。在图书馆领域,文献资源的数字化处理将其组织成一个可搜索的数字图书馆,使用户能够更快、更方便地查找所需资料。数字图书馆的信息组织过程包括文献资料的数字化、元数据的编纂和组织,以便使用户能够通过搜索、分类和浏览等方式快速找到所需资料。在档案管理方面,对于电子文件进行标识、描述和分类不仅能确保档案在电子环境中的可管理性和可检索性,而且也使得大量的电子文件和数据能够以数字形式进行长期保存和管理。自 20 世纪末以来,数 据库已成为信息资源组织和管理的重要工具。通过关系型数据库、面向对象数据库、文档数据库和键值数据库等多 种类型的数据库,信息资源的管理者可以将信息资源进行结构化存储,并建立索引和关联关系,以支持高效的检索 和利用。

    3.数据层次的序化整理

    当前,数据已成为包括图情档职业在内的诸多应用领域的核心资源。在数据层次上,数据管理的序化整理主要涉及到数据的采集、存储、清洗和分析等方面。通过数据管理技术,可以实现数据由资源化、资产化到资本化的过程。其中,数据的资源化是将数据视为组织的重要资源,对其进行有效的管理和利用。这包括收集、获取、整理和存储数据,建立适当的数据架构和存储模式,确保数据的可靠性、一致性和可访问性。数据的资产化是将数据视为组织的重要资产,为其赋予经济和战略价值。这包括对数据进行价值评估、定价和管理,制定数据资产管理策略,确保数据的安全性和保密性、合规性和合法性。数据的资本化是将数据作为组织的战略资本,利用数据为组织创造价值和竞争优势。这包括数据分析和挖掘,利用数据进行预测、决策和创新,提供数据驱动的业务洞察和智能化服务。此外,数据层面的序化整理还包括数据质量管理、数据隐私和安全管理、数据治理、数据共 享和协作等。

    概括而言,图情档学科迄今已经历了三波学科嬗变的浪潮。其中,第一波浪潮的管理形态主要是图书馆、档案馆等实体,对文献资源进行序化整理的代表性成果是分类法与主题法;第二波浪潮以文献数据库为主要管理形式,对信息资源进行序化整理的代表性成果是书目检索系统;第三波浪潮以数据产品为基本管理形态,代表性成果是各种各样的数据采集、存储、清洗、分析和加工技术。

    二、数据要素的双重理论属性

    要深入理解数据管理所代表的图情档学科嬗变的“第三次浪潮”,就需要对数据要素的理论特性加以深入剖析。结合图情档的职业使命与数据要素的本质特征,本文将数据要素的理论特性归结为如下五个方面。

    1.共享与排他

    在数字经济中,数据同时具备共享和排他两个重要特征。共享意味着数据可以被多个人自由访问和利用,促进知识传播与合作;排他则表示某些数据可以被特定个体或组织独占控制,限制其他人的访问和利用。数据作为生产要素,一开始具有排他性,即拥有者独立拥有使用权并获得收益。然而,排他性可能导致贫困陷阱等问题, 因此社会需要制度设计来保障公平性。图情档职业的使命是为用户提供广泛的信息资源并鼓励共享知识。开放获取是其中的重要共识,数据的共享性为开放获取提供了底层逻辑。排他性是数据参与市场交易的基础,而共享性为良性的数据市场化发展提供了保障。


    2.赋能与竞争

    赋能性和竞争性是数据要素的两个关键特征,它们相辅相成。赋能性关注个体和社会的发展和进步,而竞争性推动数据经济的发展和创新。在数据管理的实践中,要平衡赋能性和竞争性,使数据的共享和利用能够促进个体和社会的进步,同时实现经济效益的最大化。长期以来,图情档职业一直致力于赋能用户,通过提供广泛的信息资源和促进知识的共享,使个体和组织能够获得更多的信息和洞见,做出更好的决策和创造更大的价值。同时,图情档机构作为一种促进社会公平的制度设计,是解决社会排斥等问题的关键一环。概括而言,图情档职业致力于通过制度设计和赋能性的实践,确保数据要素的红利能够普遍均等地惠及更多社会 人群,防范和缓解社会排斥现象的出现。一个良性、完备、可持续的数据要素市场的建立,需要平衡数据的共享性和排他性,从而促进公正流通和持续发展的数据环境。这一切,都离不开包括图情档机构在内的各类社会性机构的参与和贡献。

    3.公益与交易

    数据要素兼具公益性和交易性。公益性指数据要素的使用和利益覆盖整个社会,推动社会福利和共同利益。交易性则指数据要素的买卖或交换行为,涉及市场规则和经济交换。数据管理领域包括公共数据资源管理和商业数据交易。图情档机构作为公共机构,贴近数据要素公益服务。图书馆通过数字化图书馆馆藏和在线访问服务,促进教育和学术研究的公益事业。档案管理机构通过数字化档案项目和在线访问服务,保护和提供档案资源。图书馆和情报机构建立数据分享平台和开展信息素养培训,帮助用户获取、评估和利用数据要素。总之,图情档机构在数 据要素的公益服务中发挥了重要作用,通过数据共享和知识传播完善社会福利和促进可持续发展。


    4.公有与私有

    数据要素可以在所有权和控制权上区分为公有和私有两种类型。公有数据要素属于整个社会或公共机构,由政府管理和提供;私有数据要素属于个人、家庭或私营部门,由私人所有者自主支配和利用。公共数据与社会数据的融合应用是数据要素市场一体化的突破口。由于政府在数据资源中占据主导地位,面对不断增长的数据经济, 如何体现公有制在数字经济时代的主体地位,势必成为我国当前和今后一个时期完善所有制结构的一个重要问题。 图情档机构作为公共机构,在参与公有数据要素的管理方面具有广阔前景。

    数据要素同时具有私有特征,可通过市场评价其贡献并决定报酬,这为数据要素参与分配提供了基础。然而, 如何科学界定数据要素的所有制属性及其分配机制目前并不十分明确。为此,图情档职业有必要发挥自身独特优势, 积极参与数据要素的标准制定和分配机制的设计。

    5.公平与效率

    在数据要素管理中,公平和效率是两个关键目标。公平要求数据要素的公正分配和普惠性,而效率则追求最佳资源配置和经济效益。数据管理需要在追求效率的同时关注公平,以平衡不同利益相关者的需求。数据要素参与分配可通过市场评价贡献和报酬决定的初次分配、数据财税政策的二次分配,以及引导数据企业承担社会责任的第三次分配来实现。第三次分配强调通过市场主体主动开放数据来弥补数字鸿沟,促进数据公平。对图情档职业来说,归集、整理和加工数据资源是其传统优势,如何有效融入数字经济发展是一个重要问题。总之,对图情档职业而言,通过收集、整理和归类各类数据资源,提供标准化、可访问的数据集合,可以促 进数据要素的有效利用和资源配置的高效性。同时,作为公共机构,图情档机构可以参与数据要素公益服务,让更多人能够平等地获取和利用数据要素,推动社会福利和共同利益的实现。另外,图情档机构可以承担数据素养培训和信息推广的任务,帮助用户学习如何有效地获取、评估和利用数据要素。通过提供相关培训和推广活动, 图情档机构可以提升社会大众对数据要素的认知和能力,促进数据要素的公平利用。 综上所述,数据要素的二重属性理论分野涉及共享与排他、赋能与竞争、公益与交易、公有与私有,以及公平与效率等诸多方面。这些理论特征为理解当前数据管理何以成为图情档学科嬗变 “第三次浪潮”提供了理论工具, 也为解析数据管理的内部结构提供了参考。

    三、 数据管理的三维结构

    无论是作为一门学科还是一个应用领域,数据管理都涉及了管理、技术和数据要素三个维度。在管理维度,数据管理的任务是实现无序数据的有序化;在技术维度,数据管理通过将不同密度的技术用于处理不同类型数据序化整理的问题,从而促进数据的价值化;在数据要素维度,数据管理的目标是将资源化的数据加工为数据资产,进而 通过确权、定价,使其进入市场,成为数据资产。

    1.数据资源化阶段

    数据资源的初始形态是无序的。以杂乱形式存在的数据资源由于缺乏组织和结构化,需要进一步整理和加工。 这一阶段数据资源在技术处理和加工方面的技术要求相对较低,因此属于低技术密度阶段。

    数据管理在这一阶段的主要目标是促进无序数据的资源化。具体而言,图情档职业可以通过以下方式参与数据资源化:第一,作为信息资源的管理者,图情档机构可以收集和整理各类数据资源,进行分类、编目和标引, 为其赋予结构和组织。第二,图情档机构可以提供包括建立数据仓库、数据库或数字档案系统等方面的数据资源的存储和管理服务,以便安全地存储和保护数据资源。第三,图情档机构可以利用专业技术和工具对数据资源进行数据清洗、数据挖掘、数据分析和数据可视化等方面的数据加工和加值转化,将数据资源转化为可理解、可应用的形式,为用户提供更具价值的数据产品和服务。第四,图情档职业可以推动数据资源的共享和开放,促进数 据的可访问性和可重复利用性,促进协作研究、创新和社会发展。第五,图情档职业可以继续承担数据资源培训 和教育的角色,帮助用户提升数据素养和数据技能,推动数据资源的有效利用和数据驱动决策的普及。


    2.数据资产化阶段

    数据管理不仅需要关注数据资源的整理和序化,还着重于数据资产的创造、利用和价值实现。一方面,从数据管理的角度看,结构化和中级技术密度是资产化数据的基本特征。数据资产相比于数据资源更加结构化,通常以数据库、数据仓库等形式存在。这些数据资产经过整理、清洗和组织,具有更高的技术密度,可以更方便地进行存储、 处理和分析。另一方面,数据资产的关键在于其能够为组织和企业创造价值。通过对数据的分析和挖掘,可以获得洞察和智能,支持业务决策、创新和效率提升。数据资产的利用能够帮助企业发现商业机会、优化运营、改善产品和服务,从而创造经济价值。确权和定价是数据资源实现资产化的前提。 确权是指为数据资产赋予所有权和控制权,确保其合法性和可交易性。通过确权,数据资产可以被看作是一种具有所有权的资产,进而进行交易 和定价,吸引投资和实现价值。由数据资产向数据资本演化的标志是经过确权的数据资产获得明

    确的定价。

    3.数据资本化阶段

    数据资本作为数据经济中的高级形态,呈现出流通化和高技术密度的特征。在数据资本化过程中,信息资源管理机构可以发挥重要的作用,以下是可能的贡 献方面:第一,信息资源机构有机会参与建设具有明确定价的数据资产市场交易的平台和机制,通过提供交易撮合、数据估值和合同管理等服务,促进数据资产的流通和交易,推动数据资本的市场化。第二,信息资源管理机构可以协助将数据资产进行证券化,将其转化为可交易的金融工具,吸引投资者进行投资。第三,信息资源管理机构可以提供数据资产的风险管理和保险服务。第四,信息资源管理机构可以通过技术创新和应用研究,开展数据挖掘、 人工智能和区块链等领域的研究,推动数据资本的创新和应用,为数据资本市场的发展提供技术支持和智力支持。 第五,信息资源管理机构可以为数据资本化过程中的伦理和法律问题提供指导和建议,确保数据资产的合法性和合规性,并协助处理数据隐私、知识产权和数据安全等法律问题,保护数据资产拥有者和用户的权益。综上所述,信息资源管理机构具有在数据资源向数据资产与数据资本的转型升华过程中发挥重要作用的潜能。 新兴的数据管理学科应当顺应图情档学科发展的历史潮流,合理界定自身学科定位,科学规划学科边界,合理设计学科结构,使其在数字经济时代大放异彩。

  • 原文来源:https://kns.cnki.net/kcms2/article/abstract?v=Mw9W0jY1lXDYr6rQY5M7gI7OMRYbQwQEUE1CF6Fi30l9zvz67W6vsXjNSRa3zJTKnxFCw_tGrBtJ__FSKUizQC6mf7ZtbnWhIwXLpyhFMoRf_GG2sltqDhUFGLA26H1M_fLynSmaF84=&uniplatform=NZKPT&language=CHS
相关报告
  • 《第三次半导体转移,目的地是中国大陆》

    • 来源专题:数控机床与工业机器人
    • 编译者:icad
    • 发布时间:2021-06-11
    • 众所周知,在芯片的整个环节中,晶圆制造是最关键、市场份额最大的核心环节。其技术含量高、工艺复杂,在芯片生产过程中处于至关重要的地位。 而在台积电崛起之后,集成电路的设计、封测逐渐从IDM分离,最终形成了晶圆代工这个专业环节。 而芯片代工产业,在从IDM中分离出来之后,市场规模也是逐年扩大,全球晶圆制造市场快速增长。数据显示,2021一季度,全球Top10的芯片代工企业,营收高达228.9亿美元,同比增速20.7%。2021年全年,芯片代工市场规模将接近千亿美元。 再加上去年下半年全球缺芯大潮来袭,所以这些代工厂们,也是在不断的扩充产能,以应对规模增长的市场需求。 但从实际来看,随着这些产能增长,我们越来越看到一个现实,那就是产能在逐步的转向中国大陆,意味着第三次半导体转移,真的来了。 如上图所示,这是某机构统计出来的,最近3年内,全球主要晶圆代工企业的扩产计划,里面含了台积电、intel、三星、联电、格芯、中芯国际这些主要厂商。 从这个图中,我们可以看到绝大部分的产能增长地,全部位于中国大陆,同时中国大陆的厂商们,扩建的芯片生产线也是非常多,规划的产能释放时间主要都集中在202-2022年之间。 而按照SEMI的数据,2017-2020年间全球投产的半导体晶圆厂为62座,其中有26座设于中国大陆,占全球总数的42%,并预计从2020年到2024年至少新增38个12英寸晶圆厂。 过去的这几十年,半导体产业发生了两次转移,一次是20世纪80年代左右,从美国转移到日本,于是日本半导体崛起,甚至一度成为全球最大的芯片出口国,超过了美国。 后来美国出手干预,废了日本半导体产业,于是在20世纪90年代进行了第二次转移,从日本转移至韩国、中国台湾,也就有了三星、台积电的崛起。 如今很明显,从这些扩产的产能来看,半导体产业正在进行第三次转移,目的地是中国大陆,接下来国产半导体产业链将迎来新一轮真正的景气周期。
  • 《第三次青藏高原大气科学试验取得重要成果》

    • 来源专题:大气污染防治
    • 编译者:APC
    • 发布时间:2020-07-06
    • 在过去几年数个星河壮美的夜里,有一群气象工作者埋头于数据分析。在他们心里,获取珍贵的高原大气数据亦如“摘取星辰”——那光芒现在或许微小,未来却可能照亮大气科学领域远方。  6月10日,在第三次青藏高原大气科学试验-边界层与对流层观测项目验收会上,项目负责人、中国气象科学研究院研究员赵平讲述数年“摘星之路”,也为我们勾画了一幅比过去更清晰的青藏高原大气图景。第三次青藏高原大气科学试验外场综合观测示意图(图片来源:中国气象科学研究院) 第三次向“高地”出发   在气象乃至地球科学领域,青藏高原不仅意味着海拔数据之高,更如同待攀登的科学“高地”,极其重要却也迷雾重重。  一方面,青藏高原复杂地形和加热作用对中国乃至全球天气气候产生重要影响。这个占中国陆地面积约四分之一的巍峨之地,就像一个巨大的“引擎”,总辐射量惊人,并由此形成了一个“嵌入”对流层中部大气的巨大热源,对全球与区域大气环流系统变化的动力“驱动”产生了难以估计的影响。  另一方面,囿于高原上常规观测站网稀疏、卫星产品不确定性较大等因素,相关高原气象学研究的诸多关键科学技术问题仍有待解决。  气象工作者对青藏高原的探索已持续多年。我国于1979年、1998年先后开展了第一、二次青藏高原气象科学试验,并取得了许多具有重要价值的研究成果。  到21世纪,面对这个依然至关重要的“科学议题”,气象部门酝酿“三上”高原。中国气象局党组专门向科学技术部等部门建议,国家自然科学基金委员会专程到中国气象局调研。从2009年开始,中国气象局提出立项申请。十多位院士、两百多位国内外专家多次研讨,跨部门协调会及全国研讨会就召开4次以上。  到2013年5月,中国气象局、国家自然科学基金委员会、中国科学院共同推动了第三次青藏高原大气科学试验立项,开展从陆面到平流层的三维外场综合观测以及科学理论和技术研究。  作为此次科学试验第一期行业专项重大项目,“边界层与对流层观测”的主要任务即开展青藏高原陆面水热平衡观测、边界层过程观测、云降水物理过程观测、青藏高原大气水循环综合观测、青藏高原与下游灾害天气发生区综合观测、青藏高原卫星遥感产品校验的综合观测。  与前两次青藏高原大气科学试验相比,此次试验更为宏大。赵平介绍说,在第一阶段,边界层与对流层观测项目历时数年,除了气科院牵头承担以外,参与试验的单位近50家,实际参加人员280余人;同时,观测也由过去的陆面和边界层延伸到了对流层。  此次科学试验专家指导组组长、中国科学院院士周秀骥说:“最终的想法是,通过科学试验真正提出现代化的青藏高原观测系统究竟是怎么样的,其次是将资料和成果应用到数值模式预报中,提高预报水平。”  正是背负着这样沉沉的殷切希望,科学试验领导小组和专家指导组、中国气象局相关职能部门、试验参与单位协力,科研人员一路“奔上”青藏高原。外场试验现场(图片来源:中国气象科学研究院) 在高原上布网“捕获”珍贵数据   2014年7月3日,一架“空中国王”飞机从格尔木机场飞往西藏那曲,对积云对流泡、积云、层云、层积云宏微观物理特征等多项内容进行探测。与此同时,那曲的雷达观测组所有雷达设备24小时不停机运转,那曲地区气象局同步加密探空观测。  这是我国首次开展青藏高原中部云降水物理特征飞机和地基雷达综合观测。  实际上,项目组对外场综合观测的创新设计就是立体的。从地面延伸到高空,项目组创新开展高原陆面-边界层-对流层多尺度过程观测,开发云微物理特征综合观测技术,一些观测站网的准业务运行填补了青藏高原中西部缺少土壤湿度和对流层常规气象要素探空业务观测资料空白,实现了青藏高原陆面-边界层-对流层的天-地-空一体化综合观测技术的重要突破。  每个初夏时节,科研人员穿上冲锋衣,一路向雪域高原进发。在那里,“缺氧不缺斗志,海拔高境界更高”的精神得以传承,科研人员忍受着高原缺氧、日晒强烈等艰苦条件,克服暴雨、雷击等对仪器设备运行及探空观测的干扰,每天准时开展观测。  高原工作的艰辛和不易未被辜负,一项项扎实成果陆续揭晓:构建了高原陆面-边界层观测、云降水物理过程和大气水循环观测、臭氧和气溶胶观测、高原目标区与下游灾害天气过程协同观测等观测系统;发展了高原观测资料质量控制和数据融合技术;圆满完成高原陆面-边界层物理过程、云降水物理过程与大气水循环过程、对流层-平流层大气成分特征、高原对天气气候影响等研究任务。  “该项目在构建青藏高原综合系统、发展关键水循环变量遥感反演算法和模型参数化方案、揭示重要观测事实和物理过程等方面取得多项重要创新性成果。”验收专家组组长、中国工程院院士宋君强评价说。  项目获取的珍贵数据也很快发挥了作用,比如狮泉河、改则和申扎新建全自动探空观测系统的资料已经进入全国综合气象信息共享平台(CIMISS)业务系统和中国气象数据网,进入业务平台和数值预报系统。西南低涡源地加密探空观测资料在成都区域气象中心被应用,提升了区域天气预报业务能力。西藏中西部46个土壤湿度观测点在西藏自治区气象局实现业务试运行。  此外,项目组建立起青藏高原科学考察基本资料服务专题网站,将试验观测数据慷慨共享,造福更多中国科研工作者。青藏高原科学考察基本资料服务专题网站(图片来源:中国气象科学研究院) 气象工作者在地球第三极亮起更多光束   作为地球第三极,青藏高原地位独特。相关研究也已经成为全球科学竞争的热点。  更多的试验、更翔实的数据,让项目组在描摹青藏高原大气图景时取得了大量原创性成果。  过去,科学家对于高原陆面及地-气交换时空变化特征有不同的推测,而该项目发现过去可能过高估计了高原感热强度,高原西部与中部的差异大于中部区域网内不同站之间的差异。据悉,更深入的研究将在高原试验第二阶段继续推进。  项目组提出了高原云降水微物理形成理论及维持高原水分循环物理模型,揭开了青藏高原独特的云降水物理的神秘面纱,解释了青藏高原对流活动“独立性”特征,建立起追踪高原信号影响下游暴雨过程的理论方法等,刷新人们对青藏高原大气运动机理的认知。  气象科研人员践行把“科技成果应用在实现现代化的伟大事业中”,积极回应了“科研推动业务发展”的期待。11项试验成果实现业务化、22项业务得以应用和准业务化,尤其在核心成果使用方面亮点频出,建立了高原中西部地面土壤观测网和西部自动探空准业务化系统,新研发高原探空、天气雷达、风廓线雷达资料和GPS水汽产品质量控制技术,实现了风云卫星可降水量和土壤湿度反演以及三源降水融合的国家级业务化,显著提升了风云二号F星和GPS国家级可降水业务产品在青藏高原地区的质量,并达到国际先进水平,数据产品的应用也提升了国家级和省级天气预报业务水平。  “当前科技管理工作在发生变化,更关注取得成果和发挥作用,而不是发了多少论文。”中国气象局科技与气候变化司司长姚学祥表示,“我们将进一步组织梳理项目取得的突破性进展,探讨成果对未来业务规划布局的启示。”  掌声过后,是更多期待与责任。专家指导组副组长、中国工程院院士徐祥德建议在下一步探索中增加智能化内容;专家指导组副组长、中国科学院院士吴国雄建议联合更多省份气象部门继续推进青藏高原大气科学研究。  对研究者来说,了解青藏高原越多,越能感受其辽阔、雄伟景色背后的美丽。每个数据的改进、每个公式的优化,都如同射出的光束,引领着我们去探索那条由星光勾勒出来的路径。