《布鲁金斯学会:暂停人工智能训练是不可取的》

  • 来源专题:人工智能
  • 编译者: 高楠
  • 发布时间:2023-06-09
  • 2023年4月11日,布鲁金斯学会(Brookings Institution)发布其客座高级研究员约翰·维拉塞纳(John Villasenor)撰写的评论文章《暂停训练大型人工智能系统会产生的问题(The problems with a moratorium on training large AI systems)》。文章针对生命未来研究所(Future of Life Institute)在今年三月底发布的公开信提出异议,该公开信呼吁“所有人工智能实验室立即暂停训练比GPT-4更强大的人工智能系统至少六个月,并且这种暂停应该是公开的、可核查的,并包括所有关键行为者。如果不能迅速颁布这种暂停令,政府应介入并实行暂停”。该公开信还指出,“只有在我们确信强大的人工智能系统的效果是积极的、其风险是可控的时候,才应该开发这些系统。”该公开信最初有包括许多知名的技术领袖在内的一千多人签名,后又有数千人加入签名。

    文章认为,个别公司和大学应有权决定是否进行人工智能的研发工作,以及以何种速度进行人工智能的研发工作,并且,美国政府出面暂停训练强大的人工智能系统可能会引起以下六点担忧。首先,禁令将推迟人工智能能带来的好处。目前,人工智能已助力于药物开发、医疗诊断、气候建模、天气预报、教育等许多领域,而大型人工智能系统更将产生我们无法提前预见的好处。如果推迟某些应用,如用来改善教育和扩大法律服务的使用范围的大型语言模型,也将产生严重的后果。因此,如果政府在全国范围内强行停止一种关键类别的人工智能的研发工作,将不可避免地推迟获得该技术的好处。其次,禁令本身在法律上存疑。美国联邦政府或州政府实体都没有明确的法律权力来发布暂停训练大型人工智能系统的禁令。例如,联邦贸易委员会(Federal Trade Commission, FTC)的使命是“保护公众免受欺骗性或不公平的商业行为和不公平的竞争方法的影响”。但FTC的暂停令将阻碍开发更好的人工智能系统的公平企业竞争,反而促使它们步调一致地停止然后再重新开始训练大型人工智能模型的工作,尽管国会在商业条款下有广泛的立法权,但这种权力也受到限制。同时,这一禁令也会对《第一修正案(the First Amendment)》产生影响,该修正案保护信息接收,如通过互联网获得的数字信息。当然,正如最近对制造人工智能图像生成器的公司提起的几起诉讼所强调的,当人工智能模型使用第三方数据进行训练时,存在复杂且未解决的版权法问题。但是,如果一家公司能够以避免违反版权法或合同的方式建立一个大型数据集,就有充分的理由(尽管未经测试)认为《第一修正案》赋予了使用这些数据来训练大型人工智能模型的权利。简而言之,无论是来自政府机构还是国会的暂停令都会立即在法院上受到质疑。第三,禁令难以有效执行。美国政府显然不会对涉嫌进行未经授权的人工智能训练的公司进行突击检查,政府也没有人力或技术资源来明确地核实暂停令在全国范围内的遵守情况。相反,暂停令可能会通过自我报告的方式实施,要求公司和大学证明他们没有从事被禁止的人工智能工作,但要获得需要被约束的公司和大学名单也并非易事。执法的另一个问题是,除非有举报人站出来,否则违反暂停令的行为几乎不可能被发现。不同于核武器开发这样的项目,其相关的材料和技术,如铀和核离心机,都很难得到,难以操作,且用途非常有限,而人工智能系统所需的关键数据和计算能力都很容易获得,而且基本上有无限的不违反禁令的用途清单。第四,禁令存在界定问题。哪些与人工智能有关的工作是应该被禁止的?受暂停令约束的人工智能系统的规模阈值是多少?什么指标或一组指标将被认为足以描述人工智能系统的规模,又由谁来测量?能否在不产生漏洞的情况下写出暂停特定规模的人工智能系统的监管语言,并避免被轻易规避?暂停令是只适用于大型人工智能系统的实际训练,还是也适用于相关技术的发展?如其中一些技术可能可以做到用更小的系统或比以前更少的训练建立强大的人工智能。第五,禁令之后依然难达共识。6个月的暂停期后人们对下一步该做什么依然缺乏共识。部分人提议将暂停令再延长六个月或更长时间,其他人则认为应该完全取消,还有人主张建立一个全新的框架。这种不确定性将使公司在招聘、研发投资和人工智能相关产品规划方面的决策非常困难。第六,禁令将使美国处于地缘政治不利地位。在美国暂停训练最大的人工智能模型的禁令在国际上不会产生任何效力。因此,其他国家的政府和公司将继续投资建设大型人工智能系统,而这项工作所带来的进步、知识和创造的就业机会将使美国在人工智能技术方面处于不利地位。

    最后,作者总结,人工智能拥有非凡的前景的同时,也产生了一系列新的风险,无论美国采取什么政策,大型人工智能系统的技术都将继续在全球范围内发展。因此,对于美国来说,保持在人工智能的最前沿来推动技术发展,并利用这些知识更好地识别和减轻风险,将比美国政府试图在全国范围内对大型人工智能系统的训练工作施加一个法律上可疑的、无法执行的、容易规避的禁令要好得多。

相关报告
  • 《各国人工智能计划的关注重点有何规律》

    • 来源专题:人工智能
    • 编译者:高楠
    • 发布时间:2023-06-09
    • 2023年4月25日,布鲁金斯学会(Brookings Institution)发布其技术创新中心客座高级研究员Kevin C. Desouza,加拿大皇家军事学院(Royal Military College of Canada)管理系教授James S. Denford以及美国亚利桑那州立大学凯瑞商学院(W. P. Carey School of Business) 助理教授Gregory S Dawson共同撰写的评论文章《WEIRD AI:了解各国在其人工智能计划中包含的内容(WEIRD AI: Understanding what nations include in their artificial intelligence plans)》。本文从34个已制定公共人工智能政策的国家的基本国家特征的角度出发,分析了这些国家的战略要素及其战略动力,以及在文化取向上相似的国家是否对人工智能政策采取了相同的方法。   首先,作者分析了各个国家的人工智能计划中的数据管理、算法管理等六个关键要素,以从中了解各个国家如何进行人工智能部署,并按照“WEIRD框架”将国家分组,来研究其文化相似性。六要素中的数据管理是指国家设想如何获取和使用从人工智能获得的数据;算法管理涉及到国家对算法问题的认识;人工智能治理指的是人工智能的包容性、透明度和公众信任,以及适当监督的必要性;研发能力发展的重点是政府对私营部门投资人工智能的激励计划;教育能力发展的重点是人们在中学、高等教育和职业阶段对人工智能的学习,公共服务改革能力发展的重点是将人工智能应用于面向公民或支持公民的服务。“WEIRD框架”是基于西方的、受教育程度、工业化程度、富裕程度和民主程度(Western,Educated, Industrialized, Rich, and Democratic)进行国家类型分类,以确定它们在通过共同的国家假设和偏见形成的类似决策过程的基础上对各种问题的处理是否有共同之处。文章中的“西方”使用《世界人口评论》对拉丁文西方的定义,即是否属于以西欧及其后殖民时代的足迹为中心,拥有共同语言和文化背景的国家。“受教育程度”是基于联合国人类发展指数中的平均受教育年限,其中12年(高中毕业)被认为是高教育和低教育之间的分界点。“工业化”采用世界银行的国内生产总值工业增加值,按照人均增加值的中位数3500美元将高工业化和低工业化分开。“富裕”采用瑞士信贷全球财富数据库中衡量每个成年人的平均财富,其中12.5万美元的财富是各国的中值。“民主”采用经济学人智库的民主指数,该指数区分了民主和专制政权的不同程度,其中混合政权的中点(5.0分)是民主和非民主的分界点。图1描绘了研究样本中的34个国家,具体如下。结果来自于纯粹的WEIRD国家,包括许多西欧国家和一些密切的贸易伙伴和盟国,如美国、加拿大、澳大利亚和新西兰。所有34个国家根据它们具有的西方、受教育、工业化和民主等属性的排列组合和分类。   其次,作者通过定性配置分析(Qualitative Configuration Analysis,QCA)比较每个国家分组与六个要素的存在与否,阐释了各国“WEIRD框架”分类和人工智能战略之间的相关性和每个国家如何单独看待人工智能以及在其特定分组中的情况。首先,在数据管理方面,拥有高度发达计划的国家有三种不同的配置。对于第一种配置为WeIRD国家(如法国、意大利、葡萄牙和西班牙)来说,“属于西方国家”是预测其是否将数据管理纳入人工智能计划的最佳因素,没有受过教育也是核心因素,因为这很可能会使这些国家意识到他们需要在数据管理方面迎头赶上。对于第二种配置的WEIrD国家(捷克、爱沙尼亚、立陶宛和波兰等)来说,民主是核心,也是预测其如何制定人工智能计划的最重要的因素,这表明这些国家已经有效地制定了数据管理计划,并将联合其民主盟友来达成目的。对于第三种配置的weirD国家(墨西哥、塞尔维亚、乌拉圭和印度等)来说,唯一重要的因素是民主程度,这些国家能够在低财富、低教育和低工业化的背景下做到这一点,表明了投资人工智能数据管理作为低成本建立人工智能政策的重要性。综合来看,这些国家有许多共同点,但一个国家属于西方国家和/或民主国家是预测一个国家如何在其计划中制定数据治理战略的最佳因素。文章还研究了哪些原因导致一些国家缺乏高度发展的数据管理计划。例如,既不富裕也不民主是wEIrd国家(俄罗斯、阿联酋)的核心原因,不属于西方国家,但受过高等教育是wEIRD国家(日本和韩国)中的核心原因。这两个组合的共同点都是工业化国家,但不是西方国家。其次,在算法管理方面,除了WeriD国家(墨西哥、塞尔维亚和乌拉圭)外,没有明显的模式显示某一类国家承认算法管理的价值。算法管理的低结果有两种配置,第一种wEIRD(日本和韩国)以及weIRD(新加坡)的核心条件是富裕和民主,第二种wEIrd(俄罗斯和阿联酋)的核心条件是不富裕和不民主,这两种配置的共同点是不属于西方国家,但属于工业化。第三,在人工智能治理方面,除了WeirD国家(墨西哥、塞尔维亚和乌拉圭)以外没有明显的人工智能治理高结果模式。而人工智能治理的低结果对应有三种不同的配置,第一种wEIRD以及weIRD,其核心原因是不属于西方国家,但属于富裕和民主国家,第二种wEIrd的核心要素是受教育,第三种weirD的核心要素是民主。六个国家的三种配置的共同点是不属于西方的分类。这三点都表明西方国家普遍比非西方国家更关心数据管理、算法管理和人工只能治理的问题。   最后,作者分析了其余三个关键要素,并从东、西方国家发展的不同出发,给出切实建议。在研发能力发展方面,东、西方国家一样,无论民主与否,同样注重能力发展和研发投资。高研发能力有四种配置,第一种配置是WEIRD国家和WEIrD国家,对于后者来说,他们虽然不是较富裕的国家,但他们仍然设法在研发方面进行大量投资。第二种配置的WeirD国家的加入是由于其普遍的民主性质,但教育、工业化和财富水平较低。第三种配置包括非西方、非民主的国家,如welRd国家(卡塔尔),对这些国家来说能力发展相较于其他要素是最重要的,其投资于人工智能的应用比其治理要重要得多。第四种配置包括非西方但民主的国家,如wEIRD国家(日本、韩国)和weIRD国家(新加坡)。在高教育能力发展方面,有WEIrD和WeirD两种配置,共七个国家,其都具有属于西方、民主但不富裕的核心条件,并且这些国家似乎正专注于创造教育机会,以便在人工智能领域追赶其他国家。三种低教育能力发展的配置则包括,第一种wEIRD国家(日本和韩国)以及weIRD国家(新加坡),第二种weIRd国家(卡塔尔),而第三种wEIrd国家(俄罗斯和阿联酋)以及weirD国家(印度),这些国家的共同因素是非西方国家。这表明改善人工智能结果而进行的教育投资主要是西方现象,与其他计划要素无关。作者就公共服务改革能力发展指出,目前没有发现任何一致的高公共服务改革能力发展的配置,但有三种对此类计划的低投资配置。第一种是wEIRD国家(日本和韩国),第二种是weIRd国家(卡塔尔),第三种是weirD国家(印度),其共同核心因素是它们都不是西方国家。作者表示其期望各国在包括某些要素方面有更多的共同点,但研究结果的零散性可能反映了各国仍处于人工智能应用的早期阶段,仍在不断摸索,但随着时间的推移,WEIRD国家将开始在什么是重要的方面趋于一致,并在他们的国家计划中得到反映。同时,东、西方在其计划中对人工智能发展采取了非常不同的方法:东方几乎只专注于建立其研发能力,在很大程度上忽视了技术管理的传统“护栏”(例如,数据治理、数据管理、教育、公共服务改革),而西方国家几乎只专注于确保这些“护栏”是否到位,在建设对人工智能发展至关重要的研发能力方面花费的精力相对较少。许多西方技术领袖呼吁暂停人工智能发展六个月,以让合适的”护栏”到位,但面对中国的领先地位,唯一审慎的策略是在继续从事人工智能发展的同时建立“护栏”,否则即使西方开发出一套伟大的“护栏”,也没有有价值的东西可以守护。
  • 《美国发布《医学成像人工智能的基础研究路线图》》

    • 来源专题:生物科技领域知识集成服务
    • 编译者:陈方
    • 发布时间:2020-09-11
    • 2019年4月16日,一份名为《医学成像人工智能(AI)的基础研究路线图》的特别报告发布在《放射学杂志》。这份报告是以2018年8月在马里兰州贝塞斯达举办的一次研讨会成果为基础,探讨了医学成像中AI应用的未来。此次研讨会获得了国立卫生研究院(NIH)、北美放射学会(RSNA)、美国放射学院(ACR)、放射学与生物医学成像研究学会(The Academy)的共同赞助。会议的目标是促进诊断医学成像应用相关方的合作,识别知识差距并制定基础研究优先领域的路线图。 图1 基础研究与转化研究的联系 报告认为,机器学习算法将在未来十年内改变临床成像实践,但目前机器学习仍处于早期阶段。报告概述了医学成像研究利用AI的五个优先研究领域: 1、需要新的图像重建和增强方法,将成像装置产生的源数据转化为适合人类解读的图像。例如可使用更小剂量的静脉造影材料、更低的辐射剂量和经历更短的扫描和重建时间来产生高质量的图像。 2、需要自动标记和注释方法来快速生成机器学习研究的训练数据。这些标记方法通常使用机器学习算法来处理来自成像报告或电子病历的信息。 3、需要开发针对临床成像数据复杂性而训练的新型机器学习算法。由于大多数深度学习研究是针对自然图像的照片和视频开展的,因此需要开发高分辨率、3D、4D、多模态和多通道的新型机器学习算法。 4、需要可以向人类用户解释或说明建议的机器学习方法。这些方法将作为一种复杂的临床“自动驾驶仪”协助人类成像专家开展工作。 5、需要经验证的图像免识别和数据共享的方法,以促进临床成像数据集的广泛可用性。在使用临床数据时隐私问题是至关重要的,因此需要适当的临床成像数据聚合方法,来产生训练机器学习所需的大量数据。 报告总结了基础研究与转化研究之间相关性(如图1所示),认为基础研究导致新的图像重建和标记方法、新的机器学习算法和解释方法出现,每种方法所形成的增强数据集、数据工程和数据科学将是AI在医学成像中的应用成功部署的关键。 该报告还描述了许多有助于产生更多公开可用、经过验证可重复使用数据集的、可用于评估的新算法和新技术,并指出为了用于机器学习,这些数据集需要能快速创建带标签或带注释的成像数据的方法。此外,必须开发针对临床成像数据量身定制的新型预训练模型体系结构和分布式训练方法,以减少对机构之间数据交换的需求。 在阐述人工智能在医学成像中的基础研究目标时,报告强调标准组织、专业协会、政府机构和私营企业必须共同努力为患者服务,而它们也将从成像技术创新中受益。 郑颖 编译自https://www.sciencedaily.com/releases/2019/04/190416132134.htm 原文标题:Roadmap for AI in medical imaging.