在全球人工智能竞争日趋白热化的背景下,我国自主研制的AI模型正迅速崭露头角。近期,国产AI“三杰”——DeepSeek、Kimi和MiniMax相继发布了新版模型,展现出了与OpenAI的GPT系列抗衡的实力。
1月20日,DeepSeek发布了DeepSeek-R1,同时开放了模型权重。DeepSeek-R1在后训练阶段大规模运用强化学习技术,即便在标注数据极少的条件下,也显著增强了模型的推理能力。测试数据显示,该模型在美国AIME2024、MATH-500和SWE-bench Verified等多个标准测试中,超越了OpenAI的o1版本,在数学、代码及自然语言推理能力上表现出色。
同日,Kimi也发布了全新的SOTA模型——k1.5多模态思考模型。Kimi官方透露,该模型在long-CoT模式下,已达到OpenAI o1正式版的水准,在short-CoT模式下的数学、代码及视觉多模态能力上大幅领先于现有顶尖模型,甚至超越了GPT-4o和Claude3.5Sonnet。
MiniMax于1月15日发布的Minimax-01模型同样表现出色,在多个标准测试中的性能与GPT-4o、Claude3.5-Sonnet不相上下,尤其在长上下文处理方面具有明显优势。这三款国产AI产品的卓越表现,彰显了我国技术的迅猛发展。
与此同时,DeepSeek的API服务定价极具竞争力,远低于OpenAI。例如,DeepSeek-R1的每百万输入tokens收费仅为1元人民币,而OpenAI的GPT-o1则需15美元(约合人民币110元),这使得DeepSeek在性价比上占据了明显优势。
我国大模型的崛起不仅是技术层面的竞争,也伴随着算力需求的激增。业内人士预测,随着市场需求的持续增长,我国将在算力建设上迎来新的发展机遇。字节跳动、小米等企业也在积极布局,推动国产算力基础设施的完善,未来竞争将更加激烈。
我国AI的快速发展令人期待,在未来的竞争中,能否与OpenAI比肩,甚至超越,让我们拭目以待。
暂无评论