据战略科技前沿微信公众号报道,2023年9月18日,美国国会研究服务部(CRS)发布《半导体和人工智能》报告。报告指出,人工智能(AI)的日益普及引起了美国国会的关注,许多国会议员正在考虑AI监管提案。AI的技术进步在很大程度上得益于底层计算硬件(也称为半导体、集成电路、微电子学或简称芯片)的进步,这些硬件提供了更强的数据处理能力以改善AI系统开发。报告简要描述了AI使用的半导体类型及其供应链问题、所面临的半导体监管挑战,并为提升美国AI竞争力提出了政策建议。
一、AI模型中使用的半导体芯片
AI泛指能够从数据中学习并做出预测、建议或分类等决策的计算系统。AI系统可用于多种应用,包括语音/视觉识别、自动驾驶、机器人过程自动化以及虚拟助手。一类流行的AI系统是深度神经网络。一般来说,AI模型的准确性随着大量数据训练而提高,这反过来又需要更多计算能力。流行的大语言模型(例如GPT-3)经过数十亿或数万亿文本数据训练来处理和生成文本。一些应用于AI模型的大数据集可能需要训练数周或数月,使用数千个芯片并花费数百万美元。这些高成本在很大程度上是运行硬件所需电力造成的。
半导体芯片旨在实现处理、存储、传感和传输数据或信号等功能。AI模型用到了不同类型芯片,包括储存大量数据的存储芯片和处理数据的逻辑芯片。据Gartner预测,AI用芯片的收入有望从2022年约440亿美元快速增长至2027年的1200亿美元。
早期的AI模型使用中央处理器(CPU)进行训练和推理。尽管CPU仍然足以进行推理,但领先的AI模型现在主要使用图形处理器(GPU)进行训练。GPU能并行处理信息,而CPU是串行处理信息。并行处理允许AI模型通过划分任务并同时执行任务来使用大量数据进行更快训练。此外,许多芯片设计公司越来越多地提供专为特定应用设计的定制逻辑芯片,即专用集成电路(ASIC)或加速器。用于AI的逻辑芯片也统称为AI芯片。
为了训练出最大AI模型,许多逻辑芯片与数据中心或超级计算设施中的其他半导体硬件(例如内存和网络芯片)以大型集群的形式连接在一起。例如,Meta正在为AI研究构建一台超级计算机,预计包含16,000个GPU,而初创公司Inflection AI正在为其AI模型构建一个包含22,000个GPU的集群。Meta、Tesla和NVIDIA等私营公司建造的一些超级计算机比世界上许多国有超级计算机还要大。
训练AI模型的公司可以购买和维护其芯片硬件基础设施,也可以通过付费购买云服务来远程访问所需硬件训练模型。根据美国联邦贸易委员会的说法,“云服务可能很昂贵,而且目前只有少数公司提供,这提高了反竞争行为的风险。”美国领先的AI应用云服务提供商包括亚马逊Web AI Services、微软Azure AI和谷歌Cloud AI。
AI训练通常受益于AI芯片的两个技术参数的改进:更高的数据处理能力(一般以万亿次/秒(trillions of operations per second,TOPS)为单位进行衡量)和更快的芯片间传输速度。许多大型AI模型(例如OpenAI的GPT模型)和领先的AI研究论文都没有明确说明用于AI模型训练的计算能力。此外,没有标准方法或工具来衡量用于训练AI模型的计算能力,因为不同公司的TOPS计算方式可能不同,并且这可能不是评估和比较AI模型的最佳指标。AI训练计算能力的透明度和全球衡量计算能力的标准方法可能会支持AI监管工作。
二、AI芯片的供应链问题
总部位于美国的公司,无论是老牌公司还是初创公司,在AI芯片的设计方面处于全球领先地位。从收入和使用情况来看,目前排名第一的AI芯片设计商是总部位于美国的NVIDIA。然而,这些芯片设计公司中的绝大多数完全依赖代工服务来生产和封装其设计的AI芯片。由于最高性能的AI芯片需要世界上最先进的制造工艺,因此大多数AI芯片设计公司依赖目前有能力制造AI芯片的两家公司:台积电(TSMC)和三星公司。
由于台积电等公司的代工服务成本高昂且产能有限,美国AI设计初创企业等小型实体经常面临将其设计进行原型化以及生产的挑战。由于AI竞争力将受益于芯片硬件的进步,帮助美国公司获得原型化、规模化的制造服务机会可能会促进长期创新。
三、美国AI芯片的监管及不足
2022年10月,美国商务部实施了管制措施,要求向中国大陆和澳门地区出口某些用于AI训练和构建超级计算机等应用的先进逻辑和相关芯片需要获得许可证,并限制使用原产于美国的技术或软件的全球芯片制造工厂在未经许可的情况下为总部位于中国的芯片设计公司制造某些先进芯片。管制措施适用于芯片间传输速度为每秒600 GB或更高且计算能力超过600 TOPS的逻辑芯片。为提供不受新许可证约束的替代产品,NVIDIA开始向中国营销A800和H800芯片,作为受管制芯片A100和H100的替代品。
该出口管制旨在限制中国大陆和澳门地区购买或生产某些可用于AI应用的先进芯片的能力。然而,中国AI公司使用国内外云服务提供商来训练AI模型并没有受到任何限制。
四、政府行动及相关政策建议
1. 根据2021年1月美国国会颁布的《2020年国家人工智能倡议法案》,提升美国在人工智能研究和开发方面的领导地位并为美国人工智能研究资源制定路线图。
2. 根据第13859号行政命令,美国国家标准与技术研究院进行了一项研究,建议联邦政府“致力于更深入、一致、长期地参与AI标准制定活动”,涉及开发“量化衡量和表征人工智能技术的指标,包括但不限于硬件及其性能方面”。
3. 2022年8月拜登总统签署了“芯片和科学法案”以扩大美国国内半导体制造能力以及下一代半导体技术研发,国会可以就扩大先进逻辑芯片的国内制造能力和改善小型实体的制造可及性的有效性行使监督权。
4. 由于许多AI模型是使用云服务进行训练,国会可以考虑进行出口管制改革,使商务部能对出售大量计算能力的云服务提供商行使监管权。