昆仑万维科技股份有限公司近日宣布,其推出的「天工大模型4.0」o1版(Skywork o1)已正式启动邀请测试。这一消息标志着公司在通用人工智能领域迈出了重要的一步,致力于通过技术创新推动更高水平的人工智能应用。
Skywork o1是昆仑万维集团发布的一系列模型之一,具备慢思考推理的能力,是国内首款具备中文逻辑推理的o1模型。该模型不仅在输出中集成了思考、计划和反思等能力,而且在标准评测集上的推理能力相比普通模型有了显著提升。此次发布的Skywork o1包括三款模型:Skywork o1Open、Skywork o1Lite和Skywork o1Preview。其中,Skywork o1Open是基于Llama3.18B的开源模型,Skywork o1Lite具备完备的思考能力,而Skywork o1Preview则提供了更加多样化和深入的思考过程。
昆仑万维集团表示,Skywork o1Open在数学和代码性能指标上均得到了显著提高,将Llama-3.1-8B的性能提升至同生态位的SOTA水平,并解决了许多轻量级模型无法应对的复杂数学问题。此外,公司还将开源两个推理任务的过程奖励模型(Process Reward Model,PRM):Skywork o1Open-PRM-1.5B和Skywork o1Open-PRM-7B,这些模型能够对每一个步骤进行评分,从而提升推理与思考能力。
Skywork o1在逻辑推理任务中的性能提升,得益于昆仑万维自研的训练方案,其中包括推理反思能力训练、推理能力强化学习和推理规划等技术。这些技术的应用使Skywork o1在常识推理、逻辑推理、数学推理以及伦理决策等诸多领域表现出色。
昆仑万维强调,Skywork o1的发布,不仅是公司在“All in AGI 与 AIGC”战略的重要举措,也是构建AI技术栈的重要一步。公司将继续致力于实现通用人工智能,使每个人都能更好地塑造和表达自我。
尝鲜地址:www.tiangong.cn
暂无评论