"最新消息,“深度求索”官方公众号宣布重大突破,DeepSeek-V3模型现已上线并公开源代码。访问chat.deepseek.com即可体验这款最新模型。"
"DeepSeek-V3是一款拥有6710亿参数的专家混合(MoE)模型,通过多个专家网络将问题空间精细划分为多个同质区域,显著增强了模型处理能力。模型在预训练阶段处理了14.8万亿token,激活了370亿参数。"
"DeepSeek-V3在多个评测中表现出色,超越了Qwen2.5-72B和Llama-3.1-405B等开源模型,并与GPT-4o和Claude-3.5-Sonnet等顶尖闭源模型相媲美。在知识、长文本处理、代码生成、数学计算和中文理解等多个领域均取得了显著进步,尤其是在算法代码和数学问题的处理上,表现尤为出色。DeepSeek-V3的生成速度也大幅提升至60 TPS,是V2.5版本的3倍。"
"为了方便开发者适配和应用DeepSeek-V3,官方不仅开源了原生FP8权重,还提供了BF16转换脚本。目前,SGLang、LMDeploy、TensorRT-LLM和MindIE等多个平台已支持V3模型的推理。"
"与此同时,DeepSeek对API服务价格进行了调整。新定价策略为:每百万输入tokens的价格为0.5元(缓存命中)或2元(缓存未命中),每百万输出tokens的价格为8元。为了推广新模型,DeepSeek特别设置了45天的优惠体验期。"
"从即日起至2025年2月8日,所有注册用户,无论是老用户还是新用户,均可享受DeepSeek-V3 API服务的优惠价格,即每百万输入tokens的价格为0.1元(缓存命中)或1元(缓存未命中),每百万输出tokens的价格为2元。"
[图片]
[图片]
[图片]
暂无评论