ChatGPT的发布引发了新一轮人工智能革命,业界掀起了围绕大语言模型的热潮,各大公司对生成式人工智能的兴趣激增。随着更大的内存数据库和分析工作负载被带到云上,公司对于计算、内存、存储和网络的需求大大增加。作为云服务提供商,亚马逊云科技(Amazon web service,简称AWS)一直在不断扩展其服务,为大模型的基础设施提供新的动力。同时,AWS深化拓展伙伴关系,于2023年11月28日宣布与英伟达(NVIDIA)开展战略合作,为生成式人工智能提供全新超级计算基础架构、软件和服务。
据Amazon官网11月29日消息,AWS推出新一代自研人工智能芯片Graviton4和Trainium2,能够为广泛的客户工作负载(包括机器学习训练和生成式人工智能应用)提供更佳的性价比和能效。
Graviton4基于ARM架构开发,适用于广泛的通用工作负载,是迄今为止最强大、最节能的AWS处理器。与前一代产品相比,Graviton4的计算性能提高了30%,内核增加了50%,内存带宽增加了75%,为在Amazon EC2上运行的各种工作负载提供了最佳的性价比和能效。此外,Graviton4通过完全加密所有高速物理硬件接口提高了安全性。Graviton4将在内存优化的Amazon EC2 R8g实例中可用,使客户能够改进其高性能数据库、内存缓存和大数据分析工作负载的执行。
Trainium2芯片专为具有高达数万亿参数的基础模型(Foundation Models,简称FMs)和大语言模型(Large Language Models,简称LLMs)的高性能训练而设计,提供上一代产品4倍的性能、3倍的内存容量以及2倍的能源效率,允许程序员以更低的成本快速训练模型,同时减少能耗。Trainium2将在Amazon EC2 Trn2实例中可用,可部署在多达10万个芯片的EC2 UltraCluster中,与AWS弹性结构适配器(Elastic Fabric Adapter,简称EFA)网络互联,提供高达65exaflops(65百亿亿次)的计算,并为客户提供按需访问超级计算机级性能。
随着每一代芯片的不断推出,AWS提供了更高的性价比和能效,让客户拥有了更多的选择。如今,Anthropic、Databricks、Datadog、Epic、Honeycomb和SAP等公司均使用了AWS设计的新一代自研芯片。作为AWS芯片设计的最新创新,Graviton4和Trainium2具备高性能、可扩展性、可靠性和低成本的特性,有望帮助客户解锁并加速生成式人工智能的下一波进步。