Meta近日宣布推出Llama系列的全新成员——Llama3.370B。该公司生成式AI副总裁Ahmad Al-Dahle在X平台公布了这一消息,强调Llama3.370B在性能上相较于之前的最大模型Llama3.1405B有了显著提升,并且成本大幅下降。
Al-Dahle指出,借助最新的训练技术,Llama3.370B在提升性能的同时,还降低了运营成本。根据Meta发布的基准测试,Llama3.370B在多个领域超越了谷歌的Gemini1.5Pro、OpenAI的GPT-4以及亚马逊新推出的Nova Pro,特别是在MMLU测试中展现出了卓越的语言理解能力。
目前,Llama3.370B模型已在Hugging Face和Llama官方平台等渠道提供下载。Meta通过开放模型策略,旨在引领AI领域。Llama模型适用于多种场景,并支持商业化应用。尽管Meta对月活跃用户超过7亿的平台设定了使用限制,需要申请特别许可,但Llama模型的下载量已超过6.5亿次,显示出其在全球AI开发者中的极高人气。
为了满足未来更大规模AI模型训练的需求,Meta正积极投资计算基础设施。公司宣布在路易斯安那州投资100亿美元建设AI数据中心,这是Meta有史以来最大的AI数据中心项目。扎克伯格在财报电话会议中透露,训练下一代Llama4模型所需的计算能力将是Llama3的10倍。Meta已购置超过10万个Nvidia GPU集群,与xAI等竞争对手的资源不相上下。
随着生成式AI模型训练成本的上升,Meta的资本支出也持续增加,2024年第二季度资本支出同比增长近33%,达到85亿美元。这一增长主要归因于Meta在服务器、数据中心和网络基础设施方面的持续投入。
暂无评论