2024年5月15日,谷歌正式发布了其最新一代TPU(张量处理器)芯片Trillium。这款专为大规模机器学习训练和部署而设计的定制芯片,将再次推动人工智能计算性能的大幅跃升,为复杂AI模型的研发应用提供强劲动力。
第六代TPU芯片Trillium采用先进的芯片架构与制程工艺,单个TPU芯片的算力较上一代产品提高了2倍以上,同时能效比也获得显著提升。Trillium芯片支持多种精度的张量运算,可灵活匹配不同AI模型的训练和推理需求。Trillium系列中首次加入了专为Transformer类大语言模型优化的大规模MLP(多层感知器)核心,与标准TPU核心协同工作,将进一步提升大模型的训练速度与效率。
为满足大规模集群部署的需要,谷歌还发布了基于Trillium芯片的全新机架系统TPU v6 Pod。每个TPU v6 Pod由512个Trillium芯片(共4096个TPU核心)组成,提供高达1.5 ExaFlops的峰值性能,较上一代提升83%。Pod系统内置了高性能互连网络,芯片间采用ICI (Inter-Chip Interconnect) 链路直连,显著降低了通信延迟,使大规模并行成为可能。
在软件层面,谷歌也发布了全新的编译和运行时框架,进一步优化了编程模型和并行调度,大幅简化了大模型分布式训练的开发流程。新的框架支持自动切分模型、划分数据子集、均衡负载等关键特性,开发者无需深入了解底层硬件细节,即可最大限度发挥TPU集群的性能优势。
此外,谷歌还宣布将与业界领先的芯片代工厂台积电合作,采用台积电的3纳米工艺制造下一代TPU,以加速产品创新迭代步伐。这也标志着谷歌在自研芯片领域的长期投入进一步深化,有望使其在定制AI芯片赛道建立更强的竞争优势。
新一代Trillium系列的推出,将助力各行业用户显著降低AI部署门槛,更高效、更经济地开发和应用前沿的机器学习模型。这对于进一步推动人工智能技术的规模化应用、加速产业智能化变革进程具有重要意义。
Trillium系列将不仅支持主流机器学习框架如TensorFlow、PyTorch、JAX等,还计划面向科研机构和高校推出面向前沿研究的TPU计划,推动人工智能领域更多突破性创新的涌现。未来,谷歌还将持续加大在AI芯片、算法、应用等层面的研发投入,为用户提供Leading Edge的技术和解决方案,加速人工智能行业整体发展。