今日,字节跳动旗下的豆包大模型发布了2024年度技术进展报告,揭示了最新版本Doubao-pro-1215在综合性能上已全面追平GPT-4,并在某些专业领域展现出更卓越的能力。这一成就标志着中国大模型技术正式迈入全球领先行列。

自今年5月首次亮相以来,豆包大模型仅用7个月时间便实现了32%的能力飞跃。官方表示,通过改进海量数据处理和创新模型架构,包括提升模型稀疏度和引入强化学习等手段,豆包在理解精度和生成质量上均有显著提升。尤其在数学和专业知识等复杂场景中,其表现甚至超越了GPT-4,而服务价格仅为后者的八分之一。

豆包、Grace、字节跳动

值得关注的是,豆包首次公开了其处理300万字超长文本的能力,表明它能够同时处理相当于“上百篇”学术报告的内容。通过运用STRING等上下文关联数据算法,以及优化的稀疏化和分布式方案,豆包将百万tokens的处理延迟控制在15秒以内,大幅提高了模型对海量外部知识的处理效率。

这一技术突破不仅彰显了中国AI技术的飞速发展,也预示着大模型应用的普及或许将因更优的性价比而加速推进。