备受瞩目的Deepseek V3现已开源!这一创新AI模型在多语言编程领域的表现显著,其成绩甚至超越了Claude3.5 Sonnet V2等强劲对手,引起了业界的广泛关注。

据悉,与先前的版本相比,Deepseek V3在性能上实现了显著提升。Deepseek V2.5在aider测评中的成功率仅有17%,而V3则大幅上升至48%,这一显著进步充分展示了其强大的能力。

image.png

Deepseek V3采用了包含6850亿参数的混合专家(MoE)架构,其中包含256个专家。模型采用sigmoid路由方式,每次计算时选取前8个专家(topk=8)参与,这种设计使得模型在处理复杂任务时更为高效,并显著提升了性能。

Deepseek V3的开源无疑将为AI社区注入新的活力。其卓越的编程能力有望在软件开发、自动化等多个领域发挥重要作用,助力各行业智能化升级。

更多信息请访问:https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main