《Open Future和OSI联合发布《开源AI中的数据治理:实现负责任与系统性访问》白皮书》

  • 编译者: 程冰
  • 发布时间:2025-07-23
  • 2025年1月,Open Future与OSI联合发布《开源AI中的数据治理:实现负责任与系统性访问》白皮书。随着开源人工智能(Open Source AI)的发展,数据治理成为确保技术民主化、公平性和透明度的关键。文中探讨了数据治理和 AI 开发中的关键挑战,包括数据治理与道德使用、开放性标准和透明度、数据中的结构性偏差、环境可持续性以及利益相关方代表性(Stakeholder representation)等方面。

    为了应对这些挑战,文中提出两个关键范式转变。一是采用数据共享方法,从开放数据框架转向更广泛的数据共享治理,其中包括各种形式的数据共享,保护权利并确保公平使用,这种方法承认数据的不同性质,从完全开放的数据集到受限的数据集,并促进创新的许可模式,例如数据信任和合作;二是扩大利益相关方范围,在 AI 生命周期中吸引更广泛的利益相关方,包括内容管理员、数据管理员和受影响的社区,通过促进 AI 开发人员和这些群体之间的合作伙伴关系,可以负责任地创建、管理和共享新的数据集。

    最后,本文提出了六大行动领域,具体如下:

    1.数据准备和溯源(Data preparation and provenance):为数据收集、分类、匿名化和元数据建立稳健的标准,以确保质量和可追溯性。

    2.偏好信号与许可机制(Preference signaling and licensing):开发诸如退出框架(opt-out frameworks)和社会许可(social licenses)等机制,以使权利持有者和社区能够控制数据的使用。  

    3.数据管理员与保管员(Data stewards and custodians):强化数据管理的角色,包括作为中介机构促进数据共享,同时确保符合伦理治理。  

    4.环境可持续性:通过共享数据集和高效的训练方法,推广减少AI对环境影响的做法。  

    5.互惠与补偿((Reciprocity and compensation):实施确保从共享数据中产生的价值公平分配的机制,特别是向边缘化社区的分配。  

    6.政策干预:倡导实施公共政策,要求数据透明化,激励数据共享,并支持开放数据集的创建。  

    开源AI有潜力推动创新、增强透明度,并在AI领域促进公平。实现这一愿景需要从以数量为主导的数据实践转向以质量和治理为核心的方法,通过采用数据共享框架、扩大利益相关方参与并解决关键的治理挑战,开源AI社区可以培育一个更具包容性和可持续性的AI生态系统。

相关报告
  • 《英国发布人工智能监管白皮书 》

    • 来源专题:人工智能
    • 编译者:高楠
    • 发布时间:2023-06-09
    • 3月30日,一封发布自安全机构生命未来研究所的联名信让人们意识到,技术成果日新月异的背后,对人工智能潜在风险和危害的担忧也在与日俱增。“让我们享受一个漫长的 AI 夏天,而不是毫无准备地冲入秋天。”联名信以此为结尾,呼吁暂停相关AI研究,直到各方协商后制定出相关安全协议。      风口浪尖之上,近日,英国政府发布了针对人工智能产业监管的白皮书(下称“白皮书”)。 白皮书提出了监管人工智能的新方法,并概述了监管机构应考虑的5条明确原则,即安全性和稳健性、透明度和可解释性、公平性、问责制和管理,以及可竞争性和补救性。 受访专家指出,在白皮书提出的五项原则中,透明度和可解释性作为人工智能技术研究和应用的基础,需要得到特别重视。此外,白皮书提出的在现有法律框架下对人工智能治理的思路,以及可信人工智能、监管沙盒等举措,能够在防范潜在风险的同时促进产业发展,对我国未来的人工智能治理有一定借鉴意义。      AI治理的五个原则      “人工智能不再是科幻小说中的东西,其发展惊人,我们需要有新的规则来确保它安全地发展。”英国科学、创新和技术部(DSIT)部长表示。 在白皮书中,DSIT概述了针对ChatGPT等人工智能治理的五项原则,分别是:安全性和稳健性、透明度和可解释性、公平性、问责制和管理,以及可竞争性和补救性。      具体而言,安全性和稳健性指人工智能应用应当以安全和稳健的方式运行,并持续识别、评估和管理风险,监管机构可采取举措确保人工智能系统整个生命周期按预期可靠运行;透明度和可解释性指开发和部署人工智能的组织应该能够沟通何时以及如何使用它,并以适当的详细程度解释系统的决策过程,以匹配使用人工智能带来的风险;公平性指人工智能的使用方式应符合英国现行法律,例如《2010年平等法》或英国GDPR,不得歧视个人或创造不公平的商业结果;可竞争性和补救性则指需要有明确的途径来质疑人工智能产生的有害结果或决定。      “透明度和可解释性是技术发展的关键要素,也是人工智能保证可信任度的基础。”北京师范大学法学院博士生导师、中国互联网协会研究中心副主任吴沈括解释道,也因此,其他原则的贯彻实施都以透明度和可解释性为基础。“这也是目前人工智能产业中各参与主体特别关注并投入资源建设的重点区域。”他说。      白皮书显示,英国政府将避免可能扼杀创新的严厉立法,并采取适应性强的方法来监管人工智能。英国计划在其人权、健康和安全以及竞争监管机构之间分配管理人工智能的责任,而不是创建一个专门负责该技术的新机构。 在吴沈括看来,人工智能治理的相关问题和目前现行的法律制度之间存在一定的逻辑关联和事实匹配,因此,现行法律仍能治理人工智能技术的相关问题。 不过他也指出,技术发展过程中出现的算法透明度、人工智能伦理等问题是最初法律制定过程当中难以预见的。“因此我认为,适时研判并引入专项人工智能法律规则有其必要性。”他表示。 据了解,在接下来的12个月里,英国监管机构将向人工智能公司发布实用指南,以及其他工具和资源,如风险评估模板,以阐明如何在其行业中实施这些原则。在议会时间允许的情况下,可以引入立法,以确保监管机构始终如一地考虑这些原则。      失控和刹车?       耐人寻味的是,白皮书推出的时间点,正值ChatGPT等高级AI技术遭受质疑的风口浪尖。 就在白皮书发布前不久,著名安全机构生命未来研究所( Future of Life Institute , FLI )呼吁全球所有研究机构暂停训练比 GPT-4 更强的系统至少六个月,理由是这种系统对社会和人类构成潜在风险;同时,要求在这六个月中来制订和 AI 相关的安全协议,其中就包括如何监管 AI 输出的内容,还有如何把 AI 创造出的内容和真实的内容区分开来。      图灵奖得主Yoshua Bengio、马斯克、苹果联合创始人Steve Wozniak、Stability AI 创始人Emad Mostaque等上千名科技大佬和AI专家已经签署公开信。甚至OpenAI CEO Sam Altman的名字一度也出现在公开信上,尽管不久之后便无端消失。 这封信在产业界掀起了轩然大波。 对外经济贸易大学数字经济与法律创新研究中心执行主任张欣认为,这封联名信及其呼吁反映了科技从业者、技术社群、社会公众以及监管机构对于人工智能的技术信任焦虑。“在技术展现其强大力量和极高发展速度的情况下,规则缺位带来的人工智能技术的种种不确定性将会影响人们对这一技术的信任。”      此次英国发布的人工智能产业监管白皮书所搭建的监管体系,能否有效让存在“失控”风险的AI“悬崖勒马”,在一定程度上提振行业的发展信心? 吴沈括表示,英国对新兴产业,如数字经济等的监管展现出实用主义色彩。其监管主要目的是增强英国市场的吸引力和活力,推动本国产业的发展,因此也更具产业友好性。 “此次产业白皮书的发布,将进一步提升监管框架的确定性、明确性,有利于增强该国甚至外国投资者的信心。”他说。      据媒体报道,英国在近日宣布将投资9亿英镑(约合人民币 75.06亿元)来打造百亿亿级(exascale)超级计算机。这样的超级计算机将被用于创建类似于ChatGPT的语言模型,并暂时命名为“BritGPT”。英国政府认为“BritGPT”将为英国在人工智能领域发展带来新的机遇。      可信AI、监管沙盒等举措助力我国产业发展      虽然人工智能并非近几年才出现的新概念,但该市场目前正处在起步发展阶段,而我国、乃至全世界对应的规则、监管机构还在逐步建构和明确。英国此次公布的监管举措及整体框架对我国未来的人工智能治理有一定的借鉴意义。 人工智能技术是否值得信任,是横亘在技术的理论和实际应用间的重要问题。英国政府在白皮书中宣布将提供相关技术和技术标准保障可信人工智能的落地,具体举措包括提供保证技术工具箱衡量研发流程中的可信度,计划分类分层拟定技术标准等。      “未来,可信人工智能仍然是各国在人工智能监管工作中的重点。”张欣指出,只有技术被确保可信,人工智能技术的研发和产业应用才能放心迈开脚步。 近年来,人工智能领域内可信人工智能的研究与应用步伐都在加快。中国信通院数据显示,截至2022年 4月,全球可信人工智能领域相关论文数量论文共计 7059 篇。美国、中国、英国是可信人工智能领域论文发表的主要国家,三国发表的论文总数占全球论文总数 53%以上。 此外,在具体举措上,英国政府还表示,将资助2万英镑建立一个监管沙盒,为人工智能企业提供测试环境。企业可以测试如何将监管应用于人工智能产品和服务,以支持创新者将新想法推向市场。而不会受监管规则的约束。      “监管沙盒与人工智能产业迭代速度快的特点相适应,对我国对人工智能产业治理亦有参考价值。”在张欣看来监管沙盒模式一方面,则能够在“沙盒”模拟中预判可能出现的风险,帮助监管方早日知晓和防范;另一方面,能够帮助激发技术创新活力,拓展产业发展的空间。 去年9月发布的《上海市促进人工智能产业发展条例》就提出,政府应当顺应人工智能快速迭代的特点,探索分级治理和沙盒监管。 吴沈括认为,从整体的监管框架上看,英国重视现行法律法规的思路对我国具有一定参考意义。针对人工智能带来的新挑战和新问题,应该充分挖掘和发挥现有的制度资源和监管资源,然后再“查漏补缺”适当引入必要的治理规范。      此外,重视产业发展的价值也值得深入思考。“本次白皮书研究并发布了一个结论——繁重、不适宜的监管可能会为中小企业的创新带来负担。”张欣指出,白皮书中体现出的监管互操作性、一致性及监管比例性,对我国未来促进中小企业科技创新就有借鉴意义。  “人工智能的治理不应当以牺牲产业发展为代价。”吴沈括表示,应当充分兼顾各方利益和诉求,在保护、保障、保卫核心价值的基础之上,兼容技术发展和产业发展的需求,最大限度推动人工智能发展的一个良性生态。
  • 《《中国制造业走向2025》白皮书发布》

    • 来源专题:数控机床——战略政策
    • 编译者:杨芳
    • 发布时间:2015-11-04
    •   作为全球经济竞争的制高点,制造业受到了各国的广泛重视,中国也出台《中国制造2025》白皮书,大力推进由“制造大国”向“制造强国”的转变。日前,赛迪顾问与IBM商业价值研究院联合发布了《中国制造业走向 ... .   作为全球经济竞争的制高点,制造业受到了各国的广泛重视,中国也出台《中国制造2025》白皮书,大力推进由“制造大国”向“制造强国”的转变。日前,赛迪顾问与IBM商业价值研究院联合发布了《中国制造业走向2025》白皮书,通过对“中国制造2025”战略的解读,以及对市场环境的分析,提出了“构建以数据洞察为驱动的新价值网络”创新发展新模式,并分析了新价值网络各个环节的战略重点及核心能力,为企业明确自身定位、制定未来发展方向、选择转型升级发展路径提供指导。   白皮书认为,创新发展是实施国家战略的具体要求,创新是“中国制造2025”的核心驱动,未来随着新一代信息技术与制造业的深入融合,制造业生产方式将趋向智能化、网络化,企业组织将走向扁平化、虚拟化,产品模式将转向定制化和服务化。企业也面临着内部挑战和外部环境变化的双重压力,必须寻求创新发展新模式。从企业内部看,生产成本上升、研发投入不足、生产组织方式较为传统都是企业目前面对和亟待解决的具体问题。从企业外部看,消费者具有更大的主导权,期望企业去了解他们真实的需求和提供卓越的服务体验。技术发展日新月异,大数据、云计算、移动、社交化、3D打印、机器人都将颠覆旧有的制造模式。另外,产业也在发生巨大变革,跨界融合、制造业服务化都将成为发展新趋势。   图片来自百度图片   为此,企业亟须寻找转型升级发展新模式,即“构建以数据洞察为驱动的新价值网络”。白皮书指出,参与者、产品和生产是价值创造过程中的三个要素。在传统价值链下,三者之间缺乏交互作用,联系不紧密,而在新价值网络下,通过大数据、云计算、物联网、移动互联网等新一代信息技术平台的作用,企业能够获得精准的数据洞察,以此为核心驱动力,改造整个研发、生产、销售等环节,实现参与者、产品和生产的协同互联;同时,数据洞察作为核心驱动力,将始终贯穿整个新价值网络。   IBM大中华区全球企业咨询服务部副总裁、制造行业总经理徐习明指出,数据洞察将始终贯穿参与者、产品和生产三个要素,使它们具有智能分析能力和自我优化能力,实现“智慧的参与者”、“智慧的产品”、“智慧的生产”的角色转变。大数据的获取方式包括以下几个方面:一是通过智能终端和智能产品直接采集数据,并通过物联网传输到大数据平台;二是通过端到端的全渠道营销,实时收集和监测消费者数据与产品数据;三是通过整合企业内外各种数据资源,建立大数据体系。   白皮书还为企业规划了实现新价值网络的参考实施路径,主要分为以下三个阶段:第一步,通过智能产品和端到端的全渠道营销,获取精准的消费者洞察和产品洞察,并从横向打通产业链各端口,纵向整合企业管理体系;第二步,整合企业内外其他数据资源,按照以消费者为中心、个性化、柔性化、大规模定制等智能制造原则重新构建自己的研发、客服、生产、供应链和物流体系;第三步,基于智能产品平台、全渠道平台、大数据体系,在地域边界和产业边界上实现扩张,整合全球资源,打造集制造和服务为一体的全球整合企业及其生态网络。   徐习明表示,新价值网络的构建是一个长期艰巨的工作。“中国制造2025”战略的实现需要杰出的创新能力、领先的信息技术能力,以及值得信赖的合作伙伴。作为中国企业35年的合作伙伴,IBM已经与中国政府、客户和市场建立了深厚的互信,IBM有能力、有价值、有意愿,也有措施成为助力“中国制造2025”战略实现的“中国合伙人”。.