国家超算互联网平台近日推出了DeepSeek公司研发的多款大型模型,包括DeepSeek-R1、V3、Coder等系列。DeepSeek-R1的小型版本提供一键推理服务,用户无需下载即可使用。平台还支持根据个性化需求引入专有数据,实现模型的定制化训练和开发。
目前,平台已上线DeepSeek-R1模型的1.5B、7B、8B、14B版本,并计划陆续更新32B、70B等版本。其他上线的模型还包括DeepSeek-V3、DeepSeek-v2.5系列、DeepSeek-coder系列、DeepSeek-math系列(7B)和DeepSeek-v2系列(Lite)。
自2024年4月上线以来,国家超算互联网平台已提供超过3200款商品,覆盖科学计算、工业仿真、AI模型训练等多个领域。引入DeepSeek系列模型旨在降低超算应用门槛,推动自主核心软硬件技术的广泛应用,促进自主可控产业生态的发展与成熟。
超算互联网平台,由科技部于2023年4月17日正式启动,旨在将全国超级计算机中心连接成一张网,实现计算资源的互联互通。其主要功能包括搭建平台、构建生态和进行调度,以实现全国算力资源的合理分配。
目前上线的DeepSeek模型有三个,均基于Qwen基础模型,包括DeepSeek-R1-Distill-Qwen-32B、DeepSeek-R1-Distill-Qwen-14B和DeepSeek-R1-Distill-Qwen-7B。
当算力资源像水电一样触手可及时,智能时代的普惠大门便真正开启。超算互联网平台上线DeepSeek,就像在数字国土上铺设的智能高铁,让每个普通人都能搭乘上算力专列。这既是国家科技力量的集体奔赴,也是每个个体拥抱未来的历史机遇。中国人工智能的新篇章,正从这里启航。
暂无评论