亚马逊发布新一代自研AI芯片Trainium3:性能提升4倍,能效提升40%
2025-12-03 14:24:53 王大永

  12 月 3 日消息,亚马逊云科技(Amazon Web Services,简称 AWS)多年来一直致力于自主研发人工智能(AI)训练芯片,今日正式推出了其最新一代产品 ——Trainium3,其规格令人印象深刻。

  在当地时间 12 月 2 日于拉斯维加斯举行的 AWS re:Invent 2025 年度技术大会上,这家云计算巨头不仅正式发布了基于其尖端 3 纳米制程 Trainium3 芯片打造的 Trainium3 UltraServer 系统,还首次透露了其 AI 训练产品路线图上的下一代产品:正在研发中的 Trainium4。据悉,Trainium4 将支持与英伟达(NVIDIA)芯片协同工作。

  据 AWS 介绍,这款第三代芯片及其配套系统在 AI 模型训练和推理性能方面相较第二代产品实现了显著提升。具体而言,新系统在训练和高负载推理场景下的速度提升超过 4 倍,内存容量也增至 4 倍。此外,AWS 表示,数千台 UltraServer 可相互连接,构建出搭载最多 100 万颗 Trainium3 芯片的超大规模集群 ,这一规模是上一代系统的 10 倍。每台 UltraServer 最多可容纳 144 颗 Trainium3 芯片。

  更值得关注的是,AWS 强调新一代芯片和系统在能效方面较前代提升了 40%。在全球竞相建设耗电量高达数吉瓦(gigawatts)的大型数据中心之际,AWS 正致力于打造“更省电”而非“更耗电”的基础设施。

  此举显然符合 AWS 自身的商业利益,但秉承亚马逊一贯的成本意识,该公司同时承诺,这些高效系统也将为使用其 AI 云服务的客户节省开支。

  亚马逊表示,包括 Anthropic(亚马逊亦为其投资者)、日本大语言模型公司 Karakuri、SplashMusic 以及 Decart 在内的多家客户已率先采用第三代 Trainium 芯片及系统,并显著降低了推理成本。

  此外注意到,AWS 还简要披露了下一代芯片 Trainium4 的开发进展。该公司承诺,Trainium4 将带来又一次显著的性能飞跃,并将支持英伟达的 NVLink Fusion 高速芯片互连技术。这意味着基于 Trainium4 的系统不仅能与英伟达 GPU 协同运行、扩展整体性能,还能继续利用亚马逊自研的低成本服务器机架技术。

  值得注意的是,英伟达的 CUDA(统一计算设备架构)已成为当前主流 AI 应用事实上的标准平台。通过支持 NVLink Fusion,Trainium4 有望降低迁移门槛,吸引更多原本为英伟达 GPU 优化的大型 AI 应用转向亚马逊云平台。

  目前,亚马逊尚未公布 Trainium4 的具体发布时间表。若参照以往的产品发布节奏,外界或将在明年(2026 年)的 re:Invent 大会上获得更多关于 Trainium4 的详细信息。(远洋)

投稿:lukejiwang@163.com
点击展开全文
Copyright © 2002-2025 鹿科技