《美国CRS发布《半导体和人工智能》报告,建议加强云计算服务监管》

  • 来源专题:集成电路
  • 编译者: 李衍
  • 发布时间:2023-10-17
  • 据战略科技前沿微信公众号报道,2023年9月18日,美国国会研究服务部(CRS)发布《半导体和人工智能》报告。报告指出,人工智能(AI)的日益普及引起了美国国会的关注,许多国会议员正在考虑AI监管提案。AI的技术进步在很大程度上得益于底层计算硬件(也称为半导体、集成电路、微电子学或简称芯片)的进步,这些硬件提供了更强的数据处理能力以改善AI系统开发。报告简要描述了AI使用的半导体类型及其供应链问题、所面临的半导体监管挑战,并为提升美国AI竞争力提出了政策建议。

    一、AI模型中使用的半导体芯片

    AI泛指能够从数据中学习并做出预测、建议或分类等决策的计算系统。AI系统可用于多种应用,包括语音/视觉识别、自动驾驶、机器人过程自动化以及虚拟助手。一类流行的AI系统是深度神经网络。一般来说,AI模型的准确性随着大量数据训练而提高,这反过来又需要更多计算能力。流行的大语言模型(例如GPT-3)经过数十亿或数万亿文本数据训练来处理和生成文本。一些应用于AI模型的大数据集可能需要训练数周或数月,使用数千个芯片并花费数百万美元。这些高成本在很大程度上是运行硬件所需电力造成的。

    半导体芯片旨在实现处理、存储、传感和传输数据或信号等功能。AI模型用到了不同类型芯片,包括储存大量数据的存储芯片和处理数据的逻辑芯片。据Gartner预测,AI用芯片的收入有望从2022年约440亿美元快速增长至2027年的1200亿美元。

    早期的AI模型使用中央处理器(CPU)进行训练和推理。尽管CPU仍然足以进行推理,但领先的AI模型现在主要使用图形处理器(GPU)进行训练。GPU能并行处理信息,而CPU是串行处理信息。并行处理允许AI模型通过划分任务并同时执行任务来使用大量数据进行更快训练。此外,许多芯片设计公司越来越多地提供专为特定应用设计的定制逻辑芯片,即专用集成电路(ASIC)或加速器。用于AI的逻辑芯片也统称为AI芯片。

    为了训练出最大AI模型,许多逻辑芯片与数据中心或超级计算设施中的其他半导体硬件(例如内存和网络芯片)以大型集群的形式连接在一起。例如,Meta正在为AI研究构建一台超级计算机,预计包含16,000个GPU,而初创公司Inflection AI正在为其AI模型构建一个包含22,000个GPU的集群。Meta、Tesla和NVIDIA等私营公司建造的一些超级计算机比世界上许多国有超级计算机还要大。

    训练AI模型的公司可以购买和维护其芯片硬件基础设施,也可以通过付费购买云服务来远程访问所需硬件训练模型。根据美国联邦贸易委员会的说法,“云服务可能很昂贵,而且目前只有少数公司提供,这提高了反竞争行为的风险。”美国领先的AI应用云服务提供商包括亚马逊Web AI Services、微软Azure AI和谷歌Cloud AI。

    AI训练通常受益于AI芯片的两个技术参数的改进:更高的数据处理能力(一般以万亿次/秒(trillions of operations per second,TOPS)为单位进行衡量)和更快的芯片间传输速度。许多大型AI模型(例如OpenAI的GPT模型)和领先的AI研究论文都没有明确说明用于AI模型训练的计算能力。此外,没有标准方法或工具来衡量用于训练AI模型的计算能力,因为不同公司的TOPS计算方式可能不同,并且这可能不是评估和比较AI模型的最佳指标。AI训练计算能力的透明度和全球衡量计算能力的标准方法可能会支持AI监管工作。

    二、AI芯片的供应链问题

    总部位于美国的公司,无论是老牌公司还是初创公司,在AI芯片的设计方面处于全球领先地位。从收入和使用情况来看,目前排名第一的AI芯片设计商是总部位于美国的NVIDIA。然而,这些芯片设计公司中的绝大多数完全依赖代工服务来生产和封装其设计的AI芯片。由于最高性能的AI芯片需要世界上最先进的制造工艺,因此大多数AI芯片设计公司依赖目前有能力制造AI芯片的两家公司:台积电(TSMC)和三星公司。

    由于台积电等公司的代工服务成本高昂且产能有限,美国AI设计初创企业等小型实体经常面临将其设计进行原型化以及生产的挑战。由于AI竞争力将受益于芯片硬件的进步,帮助美国公司获得原型化、规模化的制造服务机会可能会促进长期创新。

    三、美国AI芯片的监管及不足

    2022年10月,美国商务部实施了管制措施,要求向中国大陆和澳门地区出口某些用于AI训练和构建超级计算机等应用的先进逻辑和相关芯片需要获得许可证,并限制使用原产于美国的技术或软件的全球芯片制造工厂在未经许可的情况下为总部位于中国的芯片设计公司制造某些先进芯片。管制措施适用于芯片间传输速度为每秒600 GB或更高且计算能力超过600 TOPS的逻辑芯片。为提供不受新许可证约束的替代产品,NVIDIA开始向中国营销A800和H800芯片,作为受管制芯片A100和H100的替代品。

    该出口管制旨在限制中国大陆和澳门地区购买或生产某些可用于AI应用的先进芯片的能力。然而,中国AI公司使用国内外云服务提供商来训练AI模型并没有受到任何限制。

    四、政府行动及相关政策建议

    1. 根据2021年1月美国国会颁布的《2020年国家人工智能倡议法案》,提升美国在人工智能研究和开发方面的领导地位并为美国人工智能研究资源制定路线图。

    2. 根据第13859号行政命令,美国国家标准与技术研究院进行了一项研究,建议联邦政府“致力于更深入、一致、长期地参与AI标准制定活动”,涉及开发“量化衡量和表征人工智能技术的指标,包括但不限于硬件及其性能方面”。

    3. 2022年8月拜登总统签署了“芯片和科学法案”以扩大美国国内半导体制造能力以及下一代半导体技术研发,国会可以就扩大先进逻辑芯片的国内制造能力和改善小型实体的制造可及性的有效性行使监督权。

    4. 由于许多AI模型是使用云服务进行训练,国会可以考虑进行出口管制改革,使商务部能对出售大量计算能力的云服务提供商行使监管权。

  • 原文来源:https://crsreports.congress.gov/product/pdf/IF/IF12497
相关报告
  • 《德勤公司发布《2025年全球半导体产业分析报告》》

    • 来源专题:集成电路与量子信息
    • 发布时间:2025-03-25
    • 据官网2月4日报道,德勤(deloitte)公司发布《2025年全球半导体产业分析报告》[1]。报告指出,半导体产业在2024年表现强劲,预计增长率达19%、销售额将达到6270亿美元(超过预期)。预计2025年销售额将达到历史新高6970亿美元,稳步迈向2030年1万亿美元销售额的理想目标。 一、2025年全球半导体产业四大分析预测 1. 生成式AI芯片在个人电脑、智能手机、企业边缘计算和物联网领域广泛应用 用于大型云数据中心的AI训练和推理芯片的成本通常高达数万美元。在2024年和2025年,这些芯片或其轻量级版本在企业边缘计算、电脑、智能手机以及物联网相关设备中得到应用。在许多情况下,这些芯片被用于生成式AI或传统AI(机器学习)或两者结合,而且两者结合应用的情况越来越多。 2. 芯片设计更注重“左移”,需要加强行业合作 德勤公司已在2023年预测,人工智能将成为人类半导体工程师的有力助手,帮助完成极其复杂的芯片设计过程以及改进和优化PPA(功率、性能和面积)的方法。截至2024年,第一代AI已经实现了通过快速迭代增强现有设计,并在更短时间内发现全新设计。到2025年,芯片设计可能会更加“左移”——一种芯片设计和开发方法,其中测试、验证和确认在芯片设计和开发过程的早期进行,其优化策略可以从简单的PPA指标发展到系统级指标(如:算效比FLOPS/W)。先进的AI能力(图神经网络和强化学习)的结合可能会继续帮助设计出更节能的芯片。特定领域和专用芯片设计预计将继续比通用芯片需求旺盛,因为一些行业(如汽车)和某些人工智能工作负载需要定制的芯片设计方法。 3. 半导体产业的人才挑战进一步加剧 在2023年的半导体产业展望分析中,德勤公司估计半导体产业到2030年需要增加100万名技术工人,即每年增加10万多名。两年后,这一预测不仅成立,而且预计2025年的人才挑战将进一步加剧。在全球范围内,各国没有足够的技术人才来满足半导体产业的劳动力需求。 从核心工程到芯片设计和制造、运营和维护,AI可能有助于缓解一些工程人才短缺,但技能差距迫在眉睫。到2025年,吸引和留住半导体产业人才可能仍然是许多组织面临的挑战,其中一个较大的问题是劳动力老龄化,这在美国甚至欧洲更为突出。再加上复杂的地缘政治格局和供应链脆弱性,全球人才供应明显面临压力。 随着美国和欧洲的制造、组装和测试的在岸和回流,芯片公司和代工厂在2025年从当地招聘更多人才时可能会面临压力。另一方面,“友岸”(与盟国的公司合作)可以为供应链提供稳定性和韧性,特别是对美国和欧盟而言。但这也需要寻找合适的技能,以帮助满足马来西亚、印度、日本和波兰等国的新产能和人才需求。 4. 在地缘政治紧张局势下建立有弹性的供应链 在2024年半导体产业展望分析中,德勤公司已经深入探讨了地缘政治紧张局势。半导体供应链在2024年运行良好,目前没有理由相信2025年供应链韧性会降低,但与往常一样,风险仍然存在。鉴于生成式AI芯片在2025年及将来的重要性(销售额占比有望高达半导体产业的50%)以及尖端芯片所需的处理器、内存和封装的较高集中度,生成式AI芯片产业可能比以往任何时候都更容易受到供应链中断的影响。尽管由于各种芯片法案,生成式AI芯片产业在地理上可能会变得不那么集中,而且在岸、回流、近岸和友邻等举措仍处于早期阶段,该产业至少在未来一两年内仍然非常脆弱。 二、未来展望 1. 目前生成式AI半导体的投资与盈利模式不匹配,存在投资过热的风险。2025年,市场仍然认为“投资不足的风险大于投资过度的风险”。如果这种态度发生转变,对生成式AI芯片的需求可能会低于预期。 2. 敏捷芯片型初创公司的竞争可能会加剧,对更广泛的半导体行业的现有企业构成挑战。2024年2-4季度,AI芯片初创公司在全球累计获得了76亿美元的风险投资。其中几家初创公司提供专业解决方案,包括基于RISC-V的定制应用程序、芯粒、大模型推理芯片、光子集成电路、芯片设计和芯片制造设备。 3. 随着美国和其他主要市场的利率可能进一步下降,有利的信贷环境可能会促进芯片企业的并购。芯片企业的并购情况已在2024年有所上升。AI芯片和其他类型芯片这两类芯片市场更可能经历并购和整合,特别具有关键知识产权(IP)的公司如果无法跟上市场步伐,可能成为收购目标。全球范围内的不确定性、可能更严格的监管和贸易冲突可能会抑制交易环境。 4. 随着地缘政治挑战席卷全球,芯片公司应该为进一步的供应链中断做好准备。传统的渠道合作伙伴模式和盟友关系可能会被颠覆,即使“本土化生产”、“友岸外包”和“近岸外包”业务已经获得了发展势头。长期的地区冲突和战争可能会进一步影响重要物资和库存的流动。所有这些都可能扰乱半导体公司的需求规划,需要其能更加敏捷地适应供应链、采购合同以及定价条款。 5. 资本支出和收入的很大一部分是由AI和生产高度先进的AI芯片所需的先进晶圆驱动的。然而,汽车、工业和消费领域的晶圆需求持续低迷,而手机和其他消费品的需求有所上升。到2025年和2026年,即使总收入和资本支出继续呈上升趋势(至少从未来9-12个月来看),但AI相关支出的下降和零部件短缺都可能对全球半导体产业产生不利影响。 [1] https://www2.deloitte.com/us/en/insights/industry/technology/technology-media-telecom-outlooks/semiconductor-industry-outlook.html
  • 《印度政府正全力以赴发展人工智能和半导体等热门领域》

    • 来源专题:新一代信息技术
    • 编译者:isticzz2022
    • 发布时间:2024-03-13
    •        上周,印度政府制定了全面的AI政策,这项耗资12亿美元的计划为创建全面的国家AI基础设施提供了机会,其中包括创建AI模型和提供计算基础设施。印度电子和信息技术部在一份新闻声明中表示,IndiaAI任务将是一个公私合作项目,以促进人工智能创新。        印度还将建立一个拥有超过10,000个图形处理单元(GPU)的人工智能计算基地。此外,人工智能市场将旨在为人工智能创新者提供人工智能即服务和预先训练的模型。它将作为人工智能创新关键资源的一站式解决方案。大公司的首席执行官们纷纷访问印度,以期在印度的人工智能领域分得一杯羹。据标普全球称,到2030年,印度可能成为世界第三大经济体,超过日本和德国。标普全球市场情报公司亚太区首席经济学家拉吉夫·比斯瓦斯在12月发表的一份研究咨询报告中表示:“以美元计算,印度的名义国内生产总值预计将从2022年的3.5万亿美元增至2030年的7.3万亿美元。印度的商业环境也变得更加友好,而十年前并非如此。经济学人智库2023年的一项商业环境准备度调查显示,印度在市场机会、技术准备、人才库以及外贸和出口管制方面具有优势。        人工智能在印度是一个新机会,迄今为止使用非常有限。与美国相比,该国的GPU安装基数很小,预计在未来两年内会增长。几乎所有主要科技公司的首席执行官——埃隆·马斯克、安迪·雅西、桑达尔·皮查伊、帕特·格尔辛格等——都在过去两年里与莫迪总理会面。        英伟达首席执行官黄仁勋去年访问了印度,并宣布与Reliance Industries合作创建人工智能基础设施,Reliance是一家拥有技术和电信部门的多元化公司。Reliance经营着印度最大的移动电话服务提供商之一Jio。Reliance正在建立一个数据中心基础设施,该基础设施将部署Nvidia的DGX Cloud CPU和GPU。 Reliance正在创建一个基础AI模型,为4.5亿移动用户托管AI应用程序。英伟达在一份声明中表示:“人工智能基础设施将托管在人工智能计算数据中心,最终将扩展到2000兆瓦。”印度数据中心运营商 Yotta 正与英伟达合作,扩大人工智能的使用。该公司预计,4,096 个英伟达 H100 GPU 将于今年 1 月投入使用,并表示到 2024 年 6 月将有 16,384 个 GPU 投入使用。到 2025 年底,这一数字将扩大到 32,768 个。        微软首席执行官萨蒂亚·纳德拉上个月访问了印度,并主要谈到了人工智能。该公司宣布了一项计划,到2025年将有200万人具备人工智能技能。微软和英伟达也在与印度机构合作,以适应印度的主要语言。据印度官方语言部门称,印度有22种官方语言。大多数人工智能机会都是间接通过印度政府实现的,印度政府更像是技术实施的监督者。然而,潜在的问题已经出现,这可能成为硅谷的警示故事。印度科技部最近的一份咨询报告指出,科技公司需要明确许可才能使用人工智能模型、否则将被认为未经测试不可靠的算法。这是在印度政府对深度伪造视频的担忧之上,印度选举将于今年晚些时候举行。硅谷公司对印度政府的强硬态度反应不佳,这导致了反弹。印度部长拉杰夫·钱德拉塞卡进一步阐明了政府的立场,称“该建议旨在阻止未经测试的人工智能平台在印度互联网上部署”,并且“该建议针对的是大型平台,而Meity的许可申请仅适用于大型平台,不适用于初创公司。”钱德拉塞卡的评论集中在LLM反应的不可靠性上,即使在美国,这也是一个有争议的话题。钱德拉塞卡说:“安全和信任是平台的法律义务,并且抱歉不可靠并不能免除法律责任。”        与印度成为半导体巨头的雄心相比,12亿美元的人工智能覆盖仍然小得多。印度正在提供100亿美元的激励措施,以吸引芯片制造商到该国,最近批准了建立三个芯片工厂的计划,其中公私投资额为150亿美元。