人类的发展离不开信息传递与交流, 以互联网为代表的信息技术日新月异, 世界正处在信息化快速发展的进程中, 信息的生产、传播和利用方式也发生根本性变革。据CNNIC发布的第39次《中国互联网络发展状况统计报告》显示[1], 截至2016年年底, 我国网民规模已达7.3亿人, 相当于欧洲人口总量, 互联网普及率达到53.2%, 以“.cn”结尾的域名总数达到2 061万, 同比增长25.9个百分点。网络信息资源已深入渗透至我国的社会、经济、文化领域, 成为记录人类活动和文明的重要载体和战略资产, 网络信息的及时保存和有效利用对推动我国社会和文化发展、增强国家综合实力具有重要意义。
国际社会高度重视网络信息资源的保存与利用, 西方发达国家或组织密集出台多项专门政策给予支持。我国在2016年发布的《促进大数据发展行动纲要》提出, 要加强互联网信息采集利用, 加强顶层设计, 加强互联网信息采集、保存和分析能力建设, 制定完善互联网信息保存相关法律法规, 构建互联网信息保存和信息服务体系[2]。从世界范围看, 网络信息的保存保护一直是国内外图书情报界的研究与工作重点, 且进行网络信息采集的机构一般为国家级图书馆。目前, 国际上已完成或正在推进的网络信息保存项目大约有100个, 从影响力和成果看, 较重要的主要有美国Inter net Archive的Archive-It项目[3]、美国国会图书馆MINERVA项目、澳大利亚国家图书馆Pandora项目、大英图书馆和英国国家档案馆等机构发起的UKWAC项目、法国国家图书馆Bn F项目、芬兰国家图书馆Finnish Web Archive项目、瑞典国家图书馆Kulturarw项目等[4]。以这些项目为代表的各国公共文化机构对国际上或所在地区有重要战略价值的网络资源进行采集, 形成各具特色的网络信息保存体系, 为传承人类文明、促进文化发展提供重要保障。
中国国家图书馆也十分重视网络信息资源的采集与保存。2003年开展“网络信息采集与保存试验项目”[5], 2007年加入国际互联网保存联盟, 并于2009年成立国家图书馆互联网信息保存保护中心, 通过国内外的广泛合作, 致力于网络信息资源的长期保存和利用服务。经过十多年积累和发展, 已形成涵盖国内外政治、经济、社会、文化、科技等领域重要网站和重大专题网络资源的特色化网络资源建设体系, 数据量达到114.73TB, 成为我国数字图书馆资源建设的重要组成部分, 为政府决策、科学研究和满足民众信息需求提供重要支持。在国家图书馆的示范和带动下, 各地方图书馆也开始根据自身需求开展具有地方文化特色的网络资源建设, 网络信息保存的规模化效益逐渐显现。通过积极实践与探索, 国家数字图书馆已初步形成较科学客观的网络资源评估和面向全国的长期保存与有效服务机制, 对在互联网环境下, 提高国家数字图书馆网络资源建设的规范性和质量水平, 促进网络信息综合应用与服务能力提升具有重要意义。本文旨在通过对国家数字图书馆在网络资源遴选、平台技术架构和资源服务等方面进行总结和分析, 为进一步改进网络资源的保存与服务工作, 不断满足社会各界的文化信息需求提供参考和借鉴。
国家数字图书馆以保存人类文明为职责, 是国内重要的文化知识传播中心。加快推进网络信息资源采集、保存和服务利用, 对承载中华数字记忆、弘扬优秀文化、促进人类信息发展具有重要战略意义。国家数字图书馆将继续深入推进网络信息的资源联建和共享, 构建全国统一的网络信息保存与服务平台, 加强技术研发与创新, 通过多种手段和方式面向全国不同用户群体开展知识化、个性化、精准化、一站式信息服务, 为扩大国家数字图书馆服务范围和提高服务能力提供支持。