近期,我国DeepSeek团队推出了最新开源大模型R1,引起了广泛关注。R1模型在性能上表现出色,在多项测试中均超越了OpenAI的o1模型,尤其在数学和编程领域的评估中表现尤为突出。

image.png

在美国AIME2024测试中,R1以79.8分领先于o1的79.2分。在MATH-500测试中,R1获得97.3分,领先于o1的96.4分。在SWE-bench Verified测试中,R1得分为49.2,超过了o1的48.9分。尽管在Codeforces代码测试中,R1仅比o1低0.3分,但整体性能与o1相当。

R1的成本优势同样显著。OpenAI的o1模型每100万tokens的输入费用高达15美元,而R1仅需0.14美元,成本降低了90%。在输出方面,o1的费用为60美元每100万tokens,R1仅需2.19美元,降低幅度达到27倍。这一巨大的成本差异,使R1在开源大模型领域独树一帜。

DeepSeek团队宣布R1开源后,众多国外网友纷纷表示赞赏,认为R1在性价比和性能方面均超越了Meta、Mistral等传统开源平台。许多用户表示,R1模型的高效推理能力使其在代码编写和数学解释等方面表现卓越,甚至有用户称其为“最像人类内心独白的模型”。苹果公司机器学习研究员Awni Hannun也对R1进行了测试,发现其在苹果M2Ultra上运行迅速且推理效率高。

R1模型的开发经历了多个阶段的训练流程,包括冷启动数据和多阶段训练,以提高其推理能力和可读性。这些技术改进确保了R1模型在各种任务中的出色表现。

随着R1的发布,我国开源大模型在国际市场上再次引发了广泛关注与讨论,众多技术爱好者对R1的潜力充满期待。R1的发布标志着我国在大模型技术领域的进一步突破,推动了开源技术的发展。

开源地址:https://huggingface.co/deepseek-ai/R1

API:https://api-docs.deepseek.com/guides/reasoning_model

划重点:

🌟 R1模型在多项测试中超越OpenAI的o1,展现出卓越的性能。

💰 R1的输入和输出成本分别低至0.14美元和2.19美元,成本降低幅度达90%。

🚀 R1开源后受到广泛关注,许多国外专家对其性能表示赞赏,认为其性价比极高。