《尖端芯片给AI装上“超级引擎”》

  • 来源专题:人工智能
  • 编译者: 袁晨
  • 发布时间:2024-06-21
  •  美国开放人工智能研究中心(OpenAI)首席执行官山姆·奥特曼等人认为,人工智能(AI)将从根本上改变世界经济,拥有强大的计算芯片供应能力至关重要。芯片是推动AI行业发展的重要因素,其性能和运算能力直接影响着AI技术的进步和应用前景。
    英国《自然》杂志网站在近日的报道中指出,工程师正竞相开发包括图形处理单元(GPU)等在内的尖端芯片,以满足未来AI的计算需求。
    GPU加快机器学习运算速度
    GPU是英伟达公司标志性的计算机芯片。传统中央处理单元(CPU)按顺序处理指令,而GPU可并行处理更多指令,因此可分布式训练程序,从而大大加快机器学习的运算速度。
    2022年,英伟达公司Hopper超级芯片在MLPerf上击败了包括图像分类和语音识别在内所有类别的竞争对手。MLPerf是国际上最权威、最有影响力的AI基准测试之一,被誉为“AI界奥运会”。
    今年3月,英伟达正式展示了性能更优异的新一代AI芯片Blackwell。它拥有2080亿个晶体管,是英伟达首个采用多芯片封装设计的GPU。随着技术发展,GPU变得越来越大,如果不能更大,就把更多GPU组合在一起,变成更大的虚拟GPU。Blackwell就是在同一个芯片上集成了两个GPU,新架构将通过芯片与芯片间的连接技术,一步步构建出更大型AI超算集群。
    如果要训练一个拥有1.8万亿个参数的GPT模型,需要8000块Hopper芯片,耗能15兆瓦,历时3个月。如果使用Blackwell芯片,只需2000块,耗能4兆瓦,就能在同样的时间内完成任务。
    AI芯片市场持续增长,英伟达目前供应了其中80%以上的产品。2023年,该公司售出55万块Hopper芯片。近日,该公司市值首次突破3万亿美元,超越苹果,仅次于微软,成为全球市值第二高的公司。
    多种芯片竞相涌现
    尽管GPU一直是AI革命的核心,但它们并非是唯一“主角”。随着AI应用的激增,AI芯片的种类也在激增,现场可编程门阵列(FPGA)可谓“一枝独秀”。
    FPGA是一种在计算和数字电路领域广泛应用的硬件设备。它以独特的可编程性和灵活性,成为嵌入式系统、高性能计算处理等多种应用的理想选择。
    这就像搭建乐高积木,工程师可将FPGA电路一个接一个地构建到他们能想象的任何设计中,无论是洗衣机传感器还是用于引导自动驾驶汽车的AI。不过,与拥有不可调节电路的AI芯片(如GPU)相比,FPGA运行速度相对更慢、效率更低。但FPGA对处理某些任务(如粒子对撞机产生的数据)很有用。英伟达加速计算集团产品营销总监戴维·萨尔瓦托指出,FPGA的易编程性也对原型设计很有帮助。
    张量处理单元(TPU)则是谷歌公司专为神经网络机器学习而定制的芯片,旨在执行矩阵计算和张量操作。TPU作为谷歌深度学习框架TensorFlow的加速器于2016年首次推出,其设计目标是提供低功耗、高效能的矩阵运算,以满足大规模机器学习和神经网络训练的需求。TPU在性能与能效之间取得了良好平衡。它们的功耗相对较低,这对于大规模数据中心和在移动设备上的应用至关重要。
    此外,元宇宙平台也在独立开发自己的芯片。谷歌、英特尔和高通成立了UXL基金会,用以开发一套支持多种AI加速器芯片的软件和工具,以此对抗英伟达的GPU。
    当然,GPU等AI芯片的兴起并不意味着传统CPU的终结,两者互相取长补短已成大势所趋。例如,有一个版本的Blackwell芯片就让GPU与CPU携手;世界上最强大的超级计算机之一、位于美国田纳西州橡树岭国家实验室的“前沿”也依赖CPU和GPU的结合,来执行高性能计算。
    考虑到过去十年芯片领域翻天覆地的变化,工程师们可能很难预测芯片的未来。将来可能会研制出使用光而非电子的光学芯片,或量子计算芯片,而进一步提升芯片性能,将加速AI在科学领域的应用。

  • 原文来源:http://www.chinasei.com.cn/xxjscy/rgzn/202406/t20240618_73345.html
相关报告
  • 《加拿大Tenstorrent与日本尖端半导体技术中心合作设计开源新型边缘2nm AI芯片》

    • 来源专题:集成电路
    • 编译者:李衍
    • 发布时间:2024-02-29
    • 据SEMI大半导体产业网报道,2月27日加拿大AI芯片初创公司Tenstorrent宣布与日本尖端半导体技术中心(LSTC)达成多层次合作协议,双方将合作设计先进人工智能(AI)芯片。 据悉,LSTC选择Tenstorrent的世界级RISC-V架构和芯片IP,用于其新型边缘2nm人工智能加速器。Tenstorrent将与日本半导体公司Rapidus合作开发最先进的逻辑半导体技术。该公司还将利用其Ascalon RISC-V CPU内核技术,为LSTC的新型边缘AI加速器共同开发RISC-V架构CPU芯片。 据了解,Tenstorrent由业内资深人士Jim Keller领导,公司采用开源RISC-V标准。
  • 《美国应用材料公司推出全新2nm及以下尖端制程芯片检测系统》

    • 来源专题:集成电路与量子信息
    • 发布时间:2025-03-25
    • 据官网2月19日报道,美国半导体设备大厂应用材料公司宣布推出最新的半导体缺陷检测系统——SEMVision H20,以帮助领先的半导体制造商进一步突破芯片微缩的极限。该系统将业界最灵敏的电子束技术(第二代冷场发射技术)与先进的 AI 图像识别相结合,可以更好、更快地分析世界上最先进芯片中的纳米级缺陷。 SEMVision H20系统利用以下两项重大创新,能以极高精度对芯片缺陷进行分类,同时分析检测结果比当今最先进技术快3倍: (1)第二代冷场发射(CFE)技术:应用材料的CFE技术是电子束成像的突破,可实现亚纳米分辨率,用于识别最小的隐藏缺陷。与传统的热场发射(TFE)技术相比,CFE在室温工作时会产生更窄的电子束,从而将纳米级图像分辨率提高50%,成像速度提高10倍。通过SEMVision H20,应用材料公司推出的第二代CFE技术,在保持业界最高灵敏度和分辨率的同时,提供了更快的吞吐量。更快的成像速度增加了每个晶圆的覆盖范围,使芯片制造商能够在三分之一的时间内收集相同数量的信息。 (2)深度学习AI图像模型:SEMVision H20使用深度学习AI功能从虚假缺陷中自动提取真实缺陷。应用材料公司的专有深度学习网络不断使用芯片制造商晶圆厂的数据进行训练,并对缺陷类型进行分类,包括空隙、残留物、划痕、颗粒等数十种缺陷类型,从而能够更准确、更有效地表征缺陷。