在最近的Re:Invent大会中,亚马逊宣布携手AI企业Anthropic共同打造全球规模最大的人工智能超级计算机。
该超级计算机的规模将超越Anthropic现有最强模型使用的集群,达到其五倍之大,一旦建成,预计将成为全球最大的人工智能训练设施。亚马逊透露,该项目名为“Rainer”,将搭载数十万颗最新AI训练芯片Trainium2。
图源备注:图片由AI生成,图片授权服务商Midjourney
亚马逊云服务(AWS)CEO马特・加曼在会议中表示,Trainium2芯片将全面上市,并专用于Trn2UltraServer集群进行前沿AI训练。相较于使用Nvidia显卡的集群,新AWS集群的成本将降低30%至40%。尽管亚马逊是全球最大的云计算服务提供商,但在生成性AI领域,竞争对手如微软和谷歌曾一度领先。不过,亚马逊今年已向Anthropic投资80亿美元,并通过AWS平台Bedrock推出了一系列助力企业运用生成性AI的工具。
此外,亚马逊还展示了即将于2025年底向客户提供的下一代训练芯片Trainium3,其性能将是当前芯片的四倍。专家指出,Trainium3在芯片间数据传输方面实现了显著优化,这对大型AI模型的开发至关重要。尽管Nvidia在AI训练领域仍占主导地位,但亚马逊的创新表明市场竞争正在加剧。
亚马逊还计划推出一系列工具,帮助企业应对生成性AI模型的高成本和可靠性问题。新推出的AWS服务Model Distillation可生成更小、更经济的模型,而Bedrock Agents则能创建和管理自动化任务的AI代理。加曼认为,企业将对亚马逊新推出的工具表现出浓厚兴趣,例如确保聊天机器人输出准确性的工具。
亚马逊的新验证工具名为“自动推理”,与OpenAI此前推出的类似产品有所区别。它通过逻辑推理对模型输出进行分析。
为此,企业需将数据和政策转换为逻辑分析格式。这种形式化推理方法在芯片设计和密码学等领域已有数十年的应用经验。通过整合多种具备自动推理功能的系统,企业能够构建更复杂的应用和服务。
划重点:
- 💻 亚马逊与Anthropic合作,打造全球最大AI超级计算机,规模超越现有最强模型集群的五倍。
- 🚀 下一代训练芯片Trainium3将于2025年底推出,性能翻四倍,助力大型AI模型发展。
- 🛠️ 亚马逊推出多项工具,协助企业处理生成性AI模型,包括确保聊天机器人输出准确性的验证工具。
暂无评论