近日,在拜登总统关于人工智能安全、可靠和值得信赖的发展的行政命令发布270天后,美国商务部宣布新的指南和工具,以帮助提高人工智能系统的安全性、可靠性和可信度。
美国商务部的美国国家标准与技术研究院(NIST)发布了三份最终指导文件,于4月首次发布以征求公众意见,以及美国人工智能安全研究所的一份旨在帮助降低风险的指导文件草案。NIST还发布了一个软件包,旨在衡量对抗性攻击如何降低人工智能系统的性能。此外,美国商务部的美国专利商标局(USPTO)发布了一份关于专利主题资格的指导更新,以解决包括人工智能在内的关键和新兴技术的创新问题,美国国家电信和信息管理局(NTIA)向白宫提交了一份报告,审查了具有广泛可用权重的大型人工智能模型的风险和收益。
美国商务部长Gina Raimondo表示:“在拜登总统和哈里斯副总统的领导下,我们商务部一直在不懈地努力实施具有历史意义的人工智能行政命令,自我们被赋予这些关键职责以来的九个月里,我们取得了重大进展。”。“人工智能是我们这一代人的决定性技术,因此我们正在快速发展,以跟上步伐,帮助确保人工智能的安全开发和部署。今天的公告表明,我们致力于为人工智能开发人员、部署人员和用户提供所需的工具,以安全地利用人工智能的潜力,同时最大限度地降低其相关风险。我们取得了很大进展,但还有很多工作要做。我们将保持势头,维护美国作为人工智能全球领导者的地位。”
NIST的文件发布涵盖了人工智能技术的各个方面,其中两份是今天首次公开。一个是美国人工智能安全研究所的指导文件的初步公开草案,旨在帮助人工智能开发人员评估和减轻生成性人工智能和两用基础模型(可用于有益或有害目的的人工智能系统)带来的风险。另一个是测试平台,旨在帮助人工智能系统用户和开发人员衡量某些类型的攻击如何降低人工智能系统的性能。在剩下的三份文件中,有两份是指导文件,旨在帮助管理生成式人工智能的风险——该技术支持许多聊天机器人以及基于文本的图像和视频创建工具——并作为NIST人工智能风险管理框架(AI RMF)和安全软件开发框架(SSDF)的配套资源。第三份报告提出了一项计划,让美国利益相关者与全球其他国家合作制定人工智能标准。
美国商务部标准与技术部副部长兼NIST主任Laurie E.Locascio表示:“尽管生成式人工智能具有潜在的转型优势,但它也带来了与传统软件截然不同的风险。”。“这些指导文件和测试平台将向软件创建者告知这些独特的风险,并帮助他们开发在支持创新的同时减轻这些风险的方法。”
USPTO的指南更新将协助USPTO人员和利益相关者根据专利法(35 U.s.C.§101)确定人工智能发明的主题资格。这一最新更新建立在之前的指导之上,为美国专利商标局和申请人如何评估专利申请和涉及人工智能技术发明的专利中权利要求的主题资格提供了进一步的清晰度和一致性。指南更新还宣布了如何在各种技术中应用该指南的三个新示例。
“美国专利商标局仍然致力于促进和保护包括人工智能在内的关键和新兴技术的创新,”负责知识产权的商务部副部长兼美国专利商标局长Kathi Vidal说。“我们期待听到公众对这一指导更新的反馈,这将进一步明确评估人工智能发明的主题资格,同时激励解决世界和社区问题所需的创新。”
美国国家电信和信息管理局即将发布的报告将审查模型权重广泛可用的两用基础模型(即“开放权重模型”)的风险和收益,并制定政策建议,在降低风险的同时最大限度地提高这些收益。开放权重模型允许开发人员在先前工作的基础上进行构建和调整,从而扩大了人工智能工具对小公司、研究人员、非营利组织和个人的可用性。
有关NIST公告的更多信息
防止两用基础模型的误用风险
人工智能基础模型是强大的工具,在广泛的任务中都很有用,有时被称为“两用”,因为它们既有好处也有坏处。NIST的美国人工智能安全研究所发布了其关于管理两用基础模型滥用风险的指导方针的初步公开草案,该草案概述了基础模型开发人员如何保护其系统免受滥用,从而对个人、公共安全和国家安全造成蓄意伤害的自愿最佳实践。
该指南草案提供了七种关键方法来减轻模型被滥用的风险,并就如何实施这些模型以及如何使其实施透明提出了建议。这些做法可以共同帮助防止模型通过开发生物武器、开展进攻性网络行动、生成儿童性虐待材料和未经同意的亲密图像等活动造成伤害。
美国东部时间2024年9月9日晚上11:59,人工智能安全研究所正在接受公众对《两用基础模型滥用风险管理》草案的意见。评论可以电子方式提交至NISTAI800-1@nist.gov主题行中有“NIST AI 800-1,管理两用基础模型的误用风险”。
测试AI模型如何应对攻击
人工智能系统的漏洞之一是其核心模型。通过将模型暴露于大量的训练数据中,它学会了做出决策。但是,如果对手用不准确的数据毒害训练数据——例如,通过引入可能导致模型将停车标志误判为限速标志的数据——模型可能会做出不正确的、潜在的灾难性决定。测试对抗性攻击对机器学习模型的影响是Dioptra的目标之一,Dioptra是一个新的软件包,旨在帮助人工智能开发人员和客户确定他们的人工智能软件在各种对抗性攻击中的表现。
开源软件可供免费下载,可以帮助包括政府机构和中小型企业在内的社区进行评估,以评估人工智能开发人员对其系统性能的说法。该软件响应了行政命令第4.1(ii)(B)节,该节要求NIST帮助进行模型测试。Dioptra通过允许用户确定哪些类型的攻击会使模型的性能降低,并量化性能降低,以便用户可以了解系统在什么情况下会发生故障的频率和情况。
管理生成型人工智能的风险
人工智能RMF生成人工智能档案(NIST AI 600-1)可以帮助组织识别生成人工智能带来的独特风险,并提出最符合其目标和优先事项的生成人工智能风险管理行动。该指南旨在成为NIST人工智能RMF用户的配套资源。它以12个风险和200多个开发人员可以采取的管理风险的行动为中心。
这12个风险包括降低网络安全攻击的进入门槛,产生错误和虚假信息或仇恨言论和其他有害内容,以及生成人工智能系统虚构或“幻觉”输出。在描述了每种风险之后,该文档提供了一个开发人员可以采取的缓解风险的行动矩阵,映射到AI RMF。
减少对用于训练AI系统的数据的威胁
第二份最终确定的出版物《生成性人工智能和两用基础模型的安全软件开发实践》(NIST特别出版物(SP)800-218A)旨在与安全软件开发框架(SP 800-218)一起使用。虽然SSDF广泛关注软件编码实践,但配套资源扩展了SSDF,部分是为了解决生成式人工智能系统的一个主要问题:它们可能会受到恶意训练数据的损害,从而对人工智能系统性能产生不利影响。
除了涵盖人工智能系统的培训和使用方面外,本指导文件还确定了潜在的风险因素和应对策略。除其他建议外,它还建议分析训练数据中的中毒、偏见、同质性和篡改迹象。
全球参与人工智能标准
人工智能系统不仅在美国,而且在世界各地都在改变社会。《人工智能标准全球参与计划》(NIST AI 100-5)是第三份最终出版物,旨在推动全球开发和实施与人工智能相关的共识标准、合作与协调以及信息共享。
该指南以NIST制定的《联邦参与人工智能标准和相关工具计划》中概述的优先事项为依据,并与《关键和新兴技术国家标准战略》挂钩。该出版物表明,来自许多国家的更广泛的多学科利益相关者参与了标准制定过程。