我国本土大模型企业DeepSeek的应用版登顶苹果中国及美国应用商店免费APP下载排行榜,成功超越了ChatGPT。

这一显著成就不仅吸引了市场的广泛关注,还对AI芯片行业巨头英伟达的股价产生了重大影响。尽管如此,英伟达发言人依然对DeepSeek给予了高度评价,称赞其在AI领域的卓越贡献,并强调DeepSeek的成功展示了如何通过测试时间缩放技术、广泛可用的模型和符合出口管制的计算资源来开发新型号。

英伟达发言人进一步补充,推理过程需要大量的英伟达GPU和高性能网络支持。目前,英伟达掌握了三种扩展规律:持续的预训练与后训练,以及创新的测试时间缩放技术。这也意味着DeepSeek使用的GPU完全符合美国的出口管制要求。

测试时间缩放技术是近年来备受关注的技术,它指出,如果一个已完整训练的AI模型在预测、生成文本或图像时投入更多计算资源以辅助推理,模型将输出更高质量的答案。该技术已应用于OpenAI的o1等模型中。

1月27日,美股三大指数收盘涨跌不一,英伟达股价暴跌16.86%,报收于每股118.58美元,创过去10个月以来的最低点。英伟达总市值蒸发5900亿美元,创下史上最大单日个股市值蒸发纪录。英伟达股价的暴跌也使得其创始人黄仁勋的身家大幅缩水210亿美元。

在英伟达的引领下,美股半导体芯片板块普遍受到冲击。DeepSeek是量化巨头幻方量化旗下的大模型公司,于1月20日正式发布了推理大模型DeepSeek-R1。R1凭借其卓越的性能、开源特性、大幅降低的售价和训练成本,引起了广泛关注。R1的预训练费用仅为557.6万美元,在2048块英伟达H800GPU集群上运行55天即可完成。

重点:

📈 DeepSeek应用版登顶苹果中国和美国地区应用商店免费APP下载排行榜。

 💬 英伟达评价DeepSeek为AI领域的卓越进步,强调推理需要大量GPU。

💸 英伟达股价暴跌16.86%,一日蒸发5900亿美元,创下史上最大单日个股市值蒸发纪录。