《基于组合赋权法的政府开放数据质量评估框架研究》

  • 来源专题:数智化图书情报
  • 编译者: 程冰
  • 发布时间:2024-11-22
  • 文章旨在构建一个综合评估框架,用于客观衡量、比较及分析各地区政府开放数据的质量与动态演变趋势,进而识别政府开放数据质量管理潜在的问题和解决进路,为政府数据服务优化与数据治理决策提供参考。依托多指标综合评价理论与德尔菲法拟定政府开放数据质量评估指标及其维度,基于单样本Wilcoxon、组合赋权法依次检验、测算评估指标的可用性、权重与维度分值,构建政府开放数据质量评估框架。围绕内容、表达、获取、保障、使用质量 5 个维度评价样本地区人民政府网站政府开放数据质量,分析存在的问题,并提出优化对策。

    文章首先介绍了政府开放数据的背景与重要性,指出政府开放数据是国家战略布局中不可或缺的基础资源。然而,部分地区政府开放数据平台存在数据更新滞后、访问受限等问题,阻碍了数字政府及业务运营管理的持续推进。因此,构建一个综合评估框架对于识别政府开放数据质量管理潜在的问题和解决进路具有重要意义。

    研究通过修正德尔菲法对评估指标进行优化,并通过问卷调查法收集数据,使用贝叶斯逻辑回归法对问卷后验分布进行统计。在指标测算阶段,研究将各级人民政府网站作为评估对象,通过问卷星在线平台设计结构化问题,获取具体数值。在指标检验阶段,基于单样本Wilcoxon法对评估指标可用性进行检验。在权重测算阶段,研究采用熵值法和频数分析法,通过组合赋权法确定各指标的权重。

    最终,研究构建了政府开放数据质量评估框架,并以北京市等人民政府网站开放数据为例,实证分析了框架的有效性。评估结果显示,不同政府网站的开放数据在内容、表达、获取、保障、使用五个维度上存在差异。例如,宁夏回族自治区人民政府网站在内容质量维度分值最低,而甘肃省人民政府网站在使用质量维度分值最低。研究建议,相关地域可以参考分值最高的网站,优化数据开放和质量管理策略。

    文章最后讨论了研究的未来展望,包括进一步丰富政府开放数据质量评估指标调研专家的领域和规模,增加评估对象的选择范围,以及通过算法、机器学习识别、预测数据异常及未来趋势,从而自主清洗、修正数据管理策略,增强数据开放的用户体验。研究者还可以通过数据质量投资回报率来帮助政府和组织理解和预测数据质量改进的经济效益,开发评估数据集市场潜力和商业价值的方法,从而指导数据开放和质量管理策略。

  • 原文来源:https://www.lis.ac.cn/CN/10.13266/j.issn.0252-3116.2024.20.002
相关报告
  • 《研究管理开放数据全景报告》

    • 来源专题:科技出版市场动态监测
    • 编译者:崔颖
    • 发布时间:2025-04-07
    •     受Jisc委托,Research Consulting联合SIRIS Academic针对英国研究管理与行政过程中产生的开放数据及其聚合与发布平台展开专项调研。本研究旨在深度解析英国研究管理开放数据的覆盖范围、应用现状及潜在价值,探索通过优化数据开放提升行业效率与洞察力的可行路径。     一、项目范围     本研究聚焦研究全生命周期(从假设提出到影响力评估)中具有开放潜力的管理与行政数据,涵盖研究管理与行政体系各环节。需特别说明: ·研究项目实施过程中产生的科研数据不属于本项目研究范畴 ·所有纳入研究范围的数据均不包含个人隐私、商业秘密及其他敏感或可识别信息 ·数据可能呈现为多源聚合、匿名化处理或关联数据形态,确保组合使用时不涉及敏感信息     本项目属于基础性研究,旨在为后续深入探索建立框架基础。虽然未提出具体的基础设施建设方案或互操作性机制,但通过全景扫描揭示了现存挑战与改进机遇。研究重点聚焦于以下两个方面: ·开放数据现状中面临的挑战 ·挑战下的提升策略 不涉及对数据采集方法或途径、更新频率、数据质量(开放标准、元数据及API等系统性指标除外)或数据应用场景适配性的评估。     本次研究呈现了当前开放数据生态的阶段性特征,为后续系统性发展提供基准参考。     二、核心研究发现 1.可用数据全面,许多领域实践出色     开放数据研究所(The Open Data Institute)将开放数据定义为“可供任何人自由访问、使用或共享的数据资源”。     围绕研究管理与行政领域的数据生态体系呈现完整架构,其作为分析洞察研究创新系统的重要基础资源具有关键价值。    在研究管理与行政流程中产生了大量多元化数据资产,其中既包含已实现开放共享的现有资源,也蕴含着具备开放潜力的待开发数据。     具体表现为三个层级: ·已建立完善管理体系,可通过开放许可协议获取 ·虽具备可及性但未实现标准化开放访问 ·具有开放可行性但尚未启动共享机制 2.研究管理和行政数据的主要参与者     英国研究数据生态的核心参与主体包括: ·资助机构:英国研究与创新署(UKRI)、苏格兰资助委员会 ·执行机构:高等教育机构(HEIs)、国家卫生与护理研究院(NIHR)等研究委托方 ·投资主体:科研基础设施投资机构 ·组织类型:公共部门、独立及私营研究机构、商业实体 ·行业组织:英国大学联盟(UUK)、GuildHE、百万加联盟等会员机构 ·专业团体:研究管理协会(ARMA) ·第三方机构:惠康基金会、Jisc、高等教育统计局(HESA)等慈善领域机构 3.复杂全景 (1)数据生产呈现多维交叉特征: 研究基础设施投资、公共部门和独立及私人研究组织、成员机构、专业团体和商业组织及慈善机构在独立产生数据的同时,可以与政府、资助者和高等教育机构交叉产生数据。 英国四个构成区域(英格兰、苏格兰、威尔士、北爱尔兰)实行差异化科研管理流程。 (2)系统冗余 ·存在可重复利用或需整合的现有数据资源 ·数据采集活动与服务平台存在功能重叠 ·跨系统数据交叉现象加剧管理复杂度与行政负担 (3)技术实现困境 ·数据访问路径多样化影响数据质量与系统互操作性 ·元数据完整性与数据源对齐程度呈现碎片化特征 ·API接口存在标准不统一、规范不明确等问题,制约程序化分析效能 (4)采用Jisc制定的六层分类框架评估数据开放程度: ? 完全开放数据:符合开放数据标准,部分满足FAIR原则(可查找、可访问、可互操作、可重用) ? 部分开放数据:未完全达到开放数据标准 ? 公开可用数据:以嵌入式形态存在于个人网页或专有平台 ? 报告/平台介导数据:数据可能作为报告中的表格,或受限于平台下载权限 ? 受控访问数据:需要订阅或注册流程获取 ? 内部专有数据:当前仅限于生成机构内部使用,但具备开放潜力 (4)实施障碍 项目参与者普遍认同数据开放价值,纷纷表示“有意愿可持续地使更多关于研究管理和行政的数据开放”,但指出以下转型阻碍: ·部门内多套系统并行 ·研究管理和行政固有流程的复杂性 ·包括财政限制在内的基础保障不足等 4.数据来源和平台     本次项目识别了118个具有某些可访问性的数据集,并根据数据源的开放性对其中76个数据集特征进行了分类。     这些数据源的展示说明了关于研究管理和行政的开放(或潜在开放)数据全景的复杂性和碎片化性质。     本次报告展示开放政府数据与开放科学政策对于数据开放形成差异化驱动以及研究生命周期各阶段存在数据衔接缺口。 5.创新发展机遇     有机遇扩展研究管理和行政开放数据,以降低成本,更好地进行洞察和分析,提升创新潜力。 机遇包括: (1)展示潜在和范围内的数据 ? 构建有利于研究管理和行政开放数据的叙事体系,拓展商业机构与公共部门参与,推动开放数据向完全开放转型,释放数据潜力。 ? 对潜在目标数据开展系统性盘查,评估开放数据路径可行性,梳理现有访问权限与许可路径(明确覆盖范围)。 ? 编制研究管理行政数据源基准清单,重点标注具备完全开放潜力的数据资产(确认输出成果)。 (2)数字和技术赋能 ● 实施成本评估:开展选型数据服务平台持续运营资源评估,涵盖技术投入与维护、数据治理、数据源聚合增强、故障排查及查询管理等全要素(成本测算)。 ● 组合数据开放策略:通过数据发布计划或信息资产登记制度(IARs),将传统以聚合形态提供的数据源转为开放数据。在确保可持续访问以支撑效率创新的同时,减少研究生态圈内互操作性缺失的复杂独立平台建设需求(破除行政壁垒)。 ● 渐进式开放框架:制定报告/平台中介型公开数据的渐进开放许可路径,建立轻量化元数据标准与通用API规范,实现多元API与开放数据的互操作共存(实现互操作性)。 (3)通过现有的开放数据政策和基础设施进行优化 ● 政策协同:对接英国相关政府部门,研判与公共部门数据开放既有政策框架(如data.gov.uk)的协同潜力(依托既有政策基础)。 ● 最佳实践推广:拓展高校与公共部门数据发布计划应用,可通过信息资产登记制度(IARs)建立跨机构重点领域协作机制,以便关键行动者能高效且可持续地共享生成的数据和信息。 ● 统计体系融合策略:评估具备官方统计属性的开放数据扩展潜力,系统性审查需纳入官方数据记录的补充内容(制定统计目录补充方案)。
  • 《零信任视角下政府开放数据的安全风险治理模式研究》

    • 来源专题:数智化图书情报
    • 编译者:程冰
    • 发布时间:2025-07-22
    • [目的/意义] 政府开放数据是国家关键战略资源,其安全风险治理对于完善数据安全管理的理论框架与实践方案有着重要意义。从零信任视角出发,构建并验证政府开放数据的安全风险治理模式。[方法/过程] 首先,遵循零信任理念和“识别—评估—控制”的主线,设计贯穿于数据生命周期全程的治理模式;其次,选取6个不同级别与地域的政府医疗卫生数据集为样本进行实证研究,检验这一模式的有效性;最后,多角度探讨样本数据的安全风险现状,分析治理效果并提出模式的优化设计。[结果/结论] 设计的风险治理模式与零信任实现良好融合,能有效防控政府开放数据面临的各类各级安全风险。应用这一模式,有助于推动政府公共数据互联共享,在数据安全可控的前提下,促进政府数据有序开放。