昆仑万维荣耀推出全球首个工业级多模态推理模型——Skywork R1V(简称“R1V”)。这款模型拥有38亿参数,性能直追闭源模型DeepSeek-R1,并在多项基准测试中胜出,展现出当前先进技术(SOTA)的强大潜力。昆仑万维决定开源R1V,旨在促进技术共享和进步,为全球AI开源社区注入新动力。
R1V凭借其卓越的多模态推理能力脱颖而出,能够流畅融合文本与视觉信息,展现出其强大的智能。具体来看,R1V在视觉问答任务中与Claude3.5Sonnet和GPT-4o等闭源模型一较高下,同时保持着顶级的文本推理能力。在MMMU基准测试中,R1V以69分的高分刷新了同等规模模型的新纪录,MathVista测试中也取得了67.5分的优异成绩,显示出其在复杂数学推理和逻辑分析方面的强大实力。
R1V的成功离不开昆仑万维研究团队的多项技术创新。其中,跨模态迁移学习技术有效地将大模型的文本推理能力迁移至视觉模态,大幅减少了多模态推理数据需求。此外,R1V采用的混合训练策略结合迭代监督微调和强化学习,动态调整思维链长度,从而提高了推理效率。值得一提的是,R1V还引入了自适应长度思维链蒸馏框架,以避免推理过程中的“过度思考”,显著提升了推理的效率和质量。
随着R1V的问世,昆仑万维不仅成为全球首家开源多模态推理模型的企业,更在全球推动通用人工智能(AGI)梦想的实现上迈出了重要步伐。模型的权重、推理代码和技术报告均已对外公开,任何人都可以通过GitHub和Hugging Face获取相关资源。
模型权重下载
Hugging Face:
https://huggingface.co/Skywork/Skywork-R1V-38B
GitHub:
https://github.com/SkyworkAI/Skywork-R1V
详细技术报告
https://github.com/SkyworkAI/Skywork-R1V/blob/main/Skywork_R1V.pdf
🌟 全球首个工业级开源多模态推理模型Skywork R1V正式发布,参数高达38亿。
🚀 R1V在多个基准测试中表现卓越,尤其在MMMU和MathVista中分别取得69分和67.5分的高分。
📚 昆仑万维开源R1V,推动技术共享,助力全球AI开源社区,助力AGI梦想实现。
暂无评论