受Jisc委托,Research Consulting联合SIRIS Academic针对英国研究管理与行政过程中产生的开放数据及其聚合与发布平台展开专项调研。本研究旨在深度解析英国研究管理开放数据的覆盖范围、应用现状及潜在价值,探索通过优化数据开放提升行业效率与洞察力的可行路径。
一、项目范围
本研究聚焦研究全生命周期(从假设提出到影响力评估)中具有开放潜力的管理与行政数据,涵盖研究管理与行政体系各环节。需特别说明:
·研究项目实施过程中产生的科研数据不属于本项目研究范畴
·所有纳入研究范围的数据均不包含个人隐私、商业秘密及其他敏感或可识别信息
·数据可能呈现为多源聚合、匿名化处理或关联数据形态,确保组合使用时不涉及敏感信息
本项目属于基础性研究,旨在为后续深入探索建立框架基础。虽然未提出具体的基础设施建设方案或互操作性机制,但通过全景扫描揭示了现存挑战与改进机遇。研究重点聚焦于以下两个方面:
·开放数据现状中面临的挑战
·挑战下的提升策略
不涉及对数据采集方法或途径、更新频率、数据质量(开放标准、元数据及API等系统性指标除外)或数据应用场景适配性的评估。
本次研究呈现了当前开放数据生态的阶段性特征,为后续系统性发展提供基准参考。
二、核心研究发现
1.可用数据全面,许多领域实践出色
开放数据研究所(The Open Data Institute)将开放数据定义为“可供任何人自由访问、使用或共享的数据资源”。
围绕研究管理与行政领域的数据生态体系呈现完整架构,其作为分析洞察研究创新系统的重要基础资源具有关键价值。
在研究管理与行政流程中产生了大量多元化数据资产,其中既包含已实现开放共享的现有资源,也蕴含着具备开放潜力的待开发数据。
具体表现为三个层级:
·已建立完善管理体系,可通过开放许可协议获取
·虽具备可及性但未实现标准化开放访问
·具有开放可行性但尚未启动共享机制
2.研究管理和行政数据的主要参与者
英国研究数据生态的核心参与主体包括:
·资助机构:英国研究与创新署(UKRI)、苏格兰资助委员会
·执行机构:高等教育机构(HEIs)、国家卫生与护理研究院(NIHR)等研究委托方
·投资主体:科研基础设施投资机构
·组织类型:公共部门、独立及私营研究机构、商业实体
·行业组织:英国大学联盟(UUK)、GuildHE、百万加联盟等会员机构
·专业团体:研究管理协会(ARMA)
·第三方机构:惠康基金会、Jisc、高等教育统计局(HESA)等慈善领域机构
3.复杂全景
(1)数据生产呈现多维交叉特征:
研究基础设施投资、公共部门和独立及私人研究组织、成员机构、专业团体和商业组织及慈善机构在独立产生数据的同时,可以与政府、资助者和高等教育机构交叉产生数据。
英国四个构成区域(英格兰、苏格兰、威尔士、北爱尔兰)实行差异化科研管理流程。
(2)系统冗余
·存在可重复利用或需整合的现有数据资源
·数据采集活动与服务平台存在功能重叠
·跨系统数据交叉现象加剧管理复杂度与行政负担
(3)技术实现困境
·数据访问路径多样化影响数据质量与系统互操作性
·元数据完整性与数据源对齐程度呈现碎片化特征
·API接口存在标准不统一、规范不明确等问题,制约程序化分析效能
(4)采用Jisc制定的六层分类框架评估数据开放程度:
? 完全开放数据:符合开放数据标准,部分满足FAIR原则(可查找、可访问、可互操作、可重用)
? 部分开放数据:未完全达到开放数据标准
? 公开可用数据:以嵌入式形态存在于个人网页或专有平台
? 报告/平台介导数据:数据可能作为报告中的表格,或受限于平台下载权限
? 受控访问数据:需要订阅或注册流程获取
? 内部专有数据:当前仅限于生成机构内部使用,但具备开放潜力
(4)实施障碍
项目参与者普遍认同数据开放价值,纷纷表示“有意愿可持续地使更多关于研究管理和行政的数据开放”,但指出以下转型阻碍:
·部门内多套系统并行
·研究管理和行政固有流程的复杂性
·包括财政限制在内的基础保障不足等
4.数据来源和平台
本次项目识别了118个具有某些可访问性的数据集,并根据数据源的开放性对其中76个数据集特征进行了分类。
这些数据源的展示说明了关于研究管理和行政的开放(或潜在开放)数据全景的复杂性和碎片化性质。
本次报告展示开放政府数据与开放科学政策对于数据开放形成差异化驱动以及研究生命周期各阶段存在数据衔接缺口。
5.创新发展机遇
有机遇扩展研究管理和行政开放数据,以降低成本,更好地进行洞察和分析,提升创新潜力。
机遇包括:
(1)展示潜在和范围内的数据
? 构建有利于研究管理和行政开放数据的叙事体系,拓展商业机构与公共部门参与,推动开放数据向完全开放转型,释放数据潜力。
? 对潜在目标数据开展系统性盘查,评估开放数据路径可行性,梳理现有访问权限与许可路径(明确覆盖范围)。
? 编制研究管理行政数据源基准清单,重点标注具备完全开放潜力的数据资产(确认输出成果)。
(2)数字和技术赋能
● 实施成本评估:开展选型数据服务平台持续运营资源评估,涵盖技术投入与维护、数据治理、数据源聚合增强、故障排查及查询管理等全要素(成本测算)。
● 组合数据开放策略:通过数据发布计划或信息资产登记制度(IARs),将传统以聚合形态提供的数据源转为开放数据。在确保可持续访问以支撑效率创新的同时,减少研究生态圈内互操作性缺失的复杂独立平台建设需求(破除行政壁垒)。
● 渐进式开放框架:制定报告/平台中介型公开数据的渐进开放许可路径,建立轻量化元数据标准与通用API规范,实现多元API与开放数据的互操作共存(实现互操作性)。
(3)通过现有的开放数据政策和基础设施进行优化
● 政策协同:对接英国相关政府部门,研判与公共部门数据开放既有政策框架(如data.gov.uk)的协同潜力(依托既有政策基础)。
● 最佳实践推广:拓展高校与公共部门数据发布计划应用,可通过信息资产登记制度(IARs)建立跨机构重点领域协作机制,以便关键行动者能高效且可持续地共享生成的数据和信息。
● 统计体系融合策略:评估具备官方统计属性的开放数据扩展潜力,系统性审查需纳入官方数据记录的补充内容(制定统计目录补充方案)。