近日,谷歌推出了第六代人工智能加速器芯片——Trillium。这一创新技术有望彻底改变人工智能的发展经济学,并推动机器学习领域的边界拓展。在谷歌新发布的Gemini2.0 AI模型训练过程中,Trillium芯片展现了卓越的性能,其训练速度是前一代产品的四倍,同时能耗大幅降低。

image.png

谷歌首席执行官桑达尔・皮查伊在发布会上指出,Trillium芯片是公司AI战略的核心所在。Gemini2.0模型的训练和推理都完全依赖于这款芯片。目前,谷歌已经在单一网络中连接了超过10万颗Trillium芯片,打造出了全球最强大的AI超级计算机之一。

Trillium芯片在技术规格上取得了多项突破。与上一代产品相比,单颗Trillium芯片的峰值计算性能提升了4.7倍,内存容量和芯片间连接带宽均实现了翻倍。更重要的是,芯片的能效提升了67%,这对于面临巨大能耗压力的数据中心来说,是一个尤为关键的改进。

image.png

在经济层面,Trillium的表现同样引人注目。谷歌表示,相较于前一代芯片,Trillium在每美元投入的训练性能上提升了2.5倍,这可能重塑AI开发的经济模型。作为Trillium的早期用户,AI21Labs已经报告了显著的性能提升。该公司首席技术官巴拉克・伦茨表示,规模、速度和成本效益方面的进展都非常显著。

谷歌在AI超级计算机架构中部署Trillium,展现了其在AI基础设施综合整合方面的方法。这一系统结合了超过10万颗Trillium芯片和每秒13拍比特的Jupiter网络,能够支持单个分布式训练任务在数十万个加速器之间扩展。

Trillium的发布将进一步加剧AI硬件领域的竞争,尤其是在Nvidia主导的市场中。虽然Nvidia的GPU仍是许多AI应用的行业标准,但谷歌的定制芯片方案可能在特定工作负载中具有优势。行业分析师认为,谷歌在定制芯片开发上的重金投入,体现了其对AI基础设施重要性的战略考量。

随着技术的不断发展,Trillium不仅代表了性能的提升,还预示着AI计算将变得更加普及和经济。谷歌表示,拥有合适的硬件和软件基础设施是推动AI持续进步的关键。未来,随着AI模型变得越来越复杂,对基础硬件的需求也将不断增长,谷歌显然有志在这一领域保持领先地位。

官方博客链接:https://cloud.google.com/blog/products/compute/trillium-tpu-is-ga

重点摘要:

🌟 Trillium芯片性能提升四倍,能耗显著降低,助力AI训练效率提升。

💰 每美元训练性能提升2.5倍,有望重塑AI开发的经济模型。

🔗 谷歌已部署超过10万颗Trillium芯片,打造全球最强大的AI超级计算机。