DeepSeek-V3模型上线：性能突破，速度提升3倍

"最新消息，“深度求索”官方公众号宣布重大突破，DeepSeek-V3模型现已上线并公开源代码。访问chat.deepseek.com即可体验这款最新模型。"

"DeepSeek-V3是一款拥有6710亿参数的专家混合（MoE）模型，通过多个专家网络将问题空间精细划分为多个同质区域，显著增强了模型处理能力。模型在预训练阶段处理了14.8万亿token，激活了370亿参数。"

"DeepSeek-V3在多个评测中表现出色，超越了Qwen2.5-72B和Llama-3.1-405B等开源模型，并与GPT-4o和Claude-3.5-Sonnet等顶尖闭源模型相媲美。在知识、长文本处理、代码生成、数学计算和中文理解等多个领域均取得了显著进步，尤其是在算法代码和数学问题的处理上，表现尤为出色。DeepSeek-V3的生成速度也大幅提升至60 TPS，是V2.5版本的3倍。"

"为了方便开发者适配和应用DeepSeek-V3，官方不仅开源了原生FP8权重，还提供了BF16转换脚本。目前，SGLang、LMDeploy、TensorRT-LLM和MindIE等多个平台已支持V3模型的推理。"

"与此同时，DeepSeek对API服务价格进行了调整。新定价策略为：每百万输入tokens的价格为0.5元（缓存命中）或2元（缓存未命中），每百万输出tokens的价格为8元。为了推广新模型，DeepSeek特别设置了45天的优惠体验期。"

"从即日起至2025年2月8日，所有注册用户，无论是老用户还是新用户，均可享受DeepSeek-V3 API服务的优惠价格，即每百万输入tokens的价格为0.1元（缓存命中）或1元（缓存未命中），每百万输出tokens的价格为2元。"

[图片]
[图片]
[图片]

DeepSeek-V3模型上线：性能突破，速度提升3倍

华为WATCHD2智能手表12月27日发售，血压监测新选择

西南石油局天然气产量突破百亿，保障国家能源安全

暂无评论

发表评论取消回复

华为WATCHD2智能手表12月27日发售，血压监测新选择

西南石油局天然气产量突破百亿，保障国家能源安全

相关推荐

暂无评论

发表评论 取消回复

搜索

DeepSeek-V3模型上线：性能突破，速度提升3倍

发表评论取消回复