近日,上海人工智能实验室宣布其书生大模型成功升级至重要版本——书生・浦语3.0(InternLM3)。据实验室透露,新版本通过优化数据框架,大幅提高了数据利用效率,有效增强了模型的思维密度。

image.png

本次升级的InternLM3-8B-Instruct模型仅需4T数据进行训练,官方宣称其整体性能超越同规模开源模型,同时训练成本降低了超过75%。特别值得一提的是,这一版本首次在通用模型中实现了常规对话与深度思考能力的结合,能够更有效地应对各种实际应用场景。

在模型评估方面,研究团队依托司南OpenCompass开源评测框架,采取了一种统一且可复现的评估方法。评估内容涵盖了CMMLU、GPQA等十多个权威评测集,涉及推理、数学、编程、指令跟随、长文本生成、对话以及综合表现等多个方面。评估结果显示,书生・浦语3.0在多数评测集中取得了领先成绩,整体性能与GPT-4o-mini相近。

上海AI实验室还强调,这一新版本的模型成为开源社区中首个支持浏览器使用的通用对话模型,能够实现超过20步的网页跳转,有效挖掘深度信息。

体验页面:https://internlm-chat.intern-ai.org.cn。

划重点:

🌟 书生・浦语3.0模型基于4T数据训练,性能超越同规模开源模型,训练成本节约超过75%。

📊 模型在多个权威评测集中取得领先,常规对话与深度思考能力的融合显著提升。

🌐 新模型支持浏览器使用,可进行深度信息挖掘,成为开源社区的亮点。