近期,北京月之暗面科技有限公司宣布,其旗下的智能助手Kimi完成了一次重大技术革新,推出了全新k1.5多模态思考模型。该模型在多模态推理及通用推理能力上达到行业前沿,标志着Kimi在人工智能领域实现了新的突破。
k1.5多模态思考模型是Kimi在短短三个月内第三次对k系列强化学习模型进行重大升级。继去年11月推出的k0-math数学模型和12月推出的k1视觉思考模型后,k1.5模型在基准测试中表现出色。在short-CoT模式下,k1.5在数学、代码、视觉多模态和通用能力上超越了全球范围内的短思考SOTA模型GPT-4o和Claude3.5Sonnet,领先幅度高达550%。在long-CoT模式下,k1.5在数学、代码和多模态推理能力上也达到了长思考SOTA模型OpenAI o1正式版的水平,这是全球范围内除OpenAI之外的公司首次实现o1正式版的多模态推理性能。
此次升级得益于Kimi技术团队的辛勤努力和创新。团队首次公开了详细的模型训练技术报告《Kimi k1.5:借助大语言模型实现强化学习的Scaling》,记录了新技术范式下的模型训练探索之路。
报告指出,k1.5模型的关键创新包括长上下文扩展,通过部分展开技术提高训练效率,同时观察到上下文长度的增加能够持续提升模型性能。此外,改进的策略优化方法和简洁的框架设计也为模型的强大性能提供了支持。值得注意的是,k1.5模型在文本和视觉数据上进行了联合训练,具备了联合推理两种模态的能力,尤其在数学能力方面表现出色,尽管在处理部分依赖图形理解的几何图形题时仍存在挑战。
为了进一步提升短链思维推理能力,团队还提出了有效的long2short方法,利用Long-CoT技术改进Short-CoT模型,在AIME、MATH500和LiveCodeBench等测试中取得了显著成绩,大幅超越了现有的短链思维模型,如GPT-4和Claude Sonnet3.5。
k1.5多模态思考模型的预览版将陆续在Kimi.com网站和最新版本的Kimi智能助手app上灰度上线。用户在操作过程中若发现模型切换按钮,即可体验这一全新升级的模型。k1.5模型擅长深度推理,能够帮助用户解决复杂的代码问题、数学问题和工作难题。
月之暗面科技有限公司表示,2025年将继续沿着既定路线图加速升级k系列强化学习模型,带来更多模态、更多领域的能力和更强的通用能力,为用户解锁更多可能性。
github报告链接:https://github.com/MoonshotAI/kimi-k1.5
暂无评论