近期,DeepSeek正式推出了自主研发的大型语言模型R1,并对外开源。这款模型在性能上表现出色,其能力被认为可与OpenAI的o1正式版相提并论。此举不仅标志着我国AI技术的重大突破,同时也为全球AI开发者提供了新的选择。

DeepSeek R1在训练后期广泛采用了强化学习技术,即便在数据标注较少的情况下,也能显著提高模型的推理能力。在数学、代码、自然语言推理等关键任务上,DeepSeek R1的表现与OpenAI o1正式版相当,充分展示了其强大的性能。

image.png

为了回馈开源社区,DeepSeek同时开源了DeepSeek-R1和DeepSeek-R1-Zero两款模型,两者均采用了660B参数规模。此外,DeepSeek还通过模型蒸馏技术,开源了6个小模型,包括32B和70B参数的模型。这些小模型在多项能力上超越了OpenAI的o1-mini,进一步丰富了开源生态。

image.png

在API定价方面,DeepSeek展现了其开放的姿态:缓存命中每百万输入tokens仅需1元,未命中则为4元;输出tokens每百万定价为16元,整体定价更具竞争力。

image.png

更重要的是,DeepSeek R1采用了标准的MIT License,允许用户无限制商用。同时,DeepSeek还鼓励用户利用R1的输出结果训练其他模型,进一步推动AI技术的普及和发展。DeepSeek R1的开源,将为全球开发者提供更强大的工具,也为AI技术的创新和应用注入新的活力,预示着AI技术平权化时代的加速到来。

论文:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

API文档:https://api-docs.deepseek.com/zh-cn/guides/reasoning_model