近年来,人工智能下一阶段的发展方向一直备受热议:是否会走向 Agent 化?是否将拥有更强的推理能力?还是实现真正的多模态融合?各种猜测层出不穷,预示着 AI 领域即将迎来一场变革。
现在,我认为是时候做出明确判断了:“模型即产品”的时代已经来临。这不仅是一种趋势,更是对当前 AI 发展格局的深刻洞察。
(adsbygoogle=window.adsbygoogle||[]).push({});
无论是学术研究的前沿动态,还是商业市场的实际走向,所有迹象都在清晰地指向这个变革性的方向。
- 通用模型规模扩张遭遇瓶颈:通用大模型的“越大越好”发展模式,正逐渐显露出其局限性。这不仅仅是技术层面上的挑战,更是经济效益上的考量。正如 GPT-4 之后的行业讨论所揭示的,模型能力提升与算力成本增长之间,并非简单的线性关系,而是日益扩大的剪刀差。模型能力可能仅以线性速度增长,但训练和运行这些庞然大物的成本,却呈指数级攀升。即使像 OpenAI 这样拥有强大技术和资源的公司,也难以找到能够覆盖其巨额投入的商业模式,更不用说其他厂商。这预示着,单纯依赖模型参数规模的扩张,来无限提升 AI 能力的时代可能已经结束。我们需要寻找更高效、更经济、更可持续的 AI 发展路径。
- 定向训练异军突起,效果远超预期:与通用模型发展受阻形成鲜明对比的是,“定向训练(Opinionated Training)”方法展现出惊人的潜力。这种训练范式,强调针对特定任务和应用场景,对模型进行精细化调优和训练。强化学习(Reinforcement Learning)和推理(Reasoning)技术的融合,更是为定向训练注入了新的活力。我们看到,模型不再是简单地“学习数据”,而是真正开始“学会任务”。这是一种质的飞跃,标志着 AI 发展思路的转变。无论是小型模型在数学领域的惊艳表现,还是代码模型从代码生成器向代码库自治管理者的进化,亦或是 Claude 在几乎零信息输入下玩转复杂游戏的案例,都证明了定向训练的强大威力。这种“小而精”、“专而强”的模型发展路线,或将成为未来 AI 应用的主流。
- 模型推理成本断崖式下降:曾经被视为 AI 应用“拦路虎”的推理成本问题,如今也得到了极大的缓解。得益于 DeepSeek 等公司在模型优化和推理加速方面的突破性进展,AI 模型的部署和应用门槛大幅降低。DeepSeek 的最新研究表明,现有的 GPU 算力,理论上已经可以满足全球数十亿人,每人每天使用前沿模型处理 1 万 tokens 的需求。这意味着,算力不再是制约 AI 普及的关键因素,AI 大规模应用的时代正在加速到来。对于模型提供商而言,仅仅依靠出售 tokens 这种“按量计费”的商业模式,显然已经无法充分挖掘 AI 模型的价值。他们必须将目光投向价值链的更高端,例如提供更垂直、更专业的模型服务和解决方案。
种种迹象都在表明,AI 产业的发展重心,正在从“通用大模型”转向“模型即产品”的新范式。这不仅是一次技术路线的调整,更是一场商业模式和产业格局的深刻变革。传统的“应用为王”理念,可能需要重新审视。长期以来,投资者和创业者都将目光聚焦于 AI 应用层,认为应用创新才是 AI 商业化的关键。然而,在“模型即产品”的时代,应用层或许会成为最先被自动化和颠覆的环节。未来的竞争焦点,将聚焦于模型本身,谁能拥有更先进、更高效、更专业的模型,谁就能在 AI 竞争中占据制高点。
未来模型的形态:专业化、垂直化、服务化
过去几周,我们已经看到了“模型即产品”范式下,涌现出的两款代表性产品:OpenAI 的 DeepResearch 和 Anthropic 的 Claude 3.7 Sonnet。这两款产品,都体现了新一代模型的发展趋势,预示着未来模型可能呈现出的形态。
OpenAI 的 DeepResearch,自发布以来就引发了广泛关注,但也伴随着不少误读。很多人将其简单地理解为 GPT-4 的一个“套壳”应用,或是基于 GPT-4 的搜索增强工具。但事实远非如此。OpenAI 实际上是训练了一个全新的模型,专门用于研究和信息检索任务。DeepResearch 并非一个依赖外部搜索引擎或工具调用的“工作流”,而是一个真正意义上的“研究型语言模型(Research Language Model)”。它具备端到端的自主搜索、浏览、信息整合和报告生成能力,无需任何外部干预。使用过 DeepResearch 的用户,都能明显感受到它与传统 LLM 或聊天机器人的巨大差异。它生成的报告,结构清晰、论证严谨、信息溯源可靠,体现出远超传统搜索工具和 LLM 的专业性和深度。
相比之下,市面上其他号称“Deep Search”的产品,例如 Perplexity 和 Google 的相关功能,则显得相形见绌。正如 Hanchung Lee 所指出的,这些产品本质上仍然是基于通用模型,进行一些简单的微调和功能叠加,缺乏针对搜索任务的深度优化和系统性设计。DeepResearch 的出现,标志着“模型即产品”理念的初步落地,也为我们展示了专业化、垂直化模型的发展方向。
Anthropic 也在积极布局“模型即产品”战略,并对 Agent 模型提出了独到的见解。他们在去年 12 月发布了一篇研究报告,对 Agent 模型进行了重新定义。Anthropic 认为,真正的 Agent 模型,应该具备“自主性(Autonomy)”,能够独立完成目标任务,而不是仅仅作为工作流中的一个环节。与 DeepResearch 类似,Anthropic 强调 Agent 模型应该在“内部(Internally)”完成任务执行的全过程,包括动态规划任务流程、自主选择和调用工具等,而不是依赖预设的代码路径和外部编排。
当前市面上涌现出大量的 Agent 创业公司,但它们所构建的“Agent”,大多仍停留在“工作流(Workflow)”层面。这些“Agent”本质上上是预先定义好的一系列代码流程,将 LLM 和各种工具串联起来,按照固定的步骤执行任务。这种“伪 Agent”方案,虽然在某些垂直领域可能具有一定的应用价值,但与 Anthropic 和 OpenAI 所定义的“真 Agent”相比,仍存在本质的差距。真正的自主系统,必须从模型层面进行重塑和创新,才能实现质的飞跃。
Anthropic Claude 3.7 的发布,进一步印证了“模型即产品”的发展趋势。Claude 3.7 是一款针对复杂代码场景进行深度优化的模型。在代码生成、代码理解、代码编辑等方面,Claude 3.7 都展现出卓越的性能。尤其是值得关注的是,即使是像 Devin 这样高度复杂和智能化的“AI 程序员”工作流,在 Claude 3.7 的加持下,也能在 SWE 基准测试中取得显著的提升。这表明,模型本身的强大能力,才是构建优秀应用的关键。与其花费大量精力去设计复杂的工作流和外部工具,不如将资源投入到模型本身的研发和优化上。
Pleias 团队在 RAG (Retrieval-Augmented Generation) 领域的探索,也体现了“模型即产品”的思路。传统的 RAG 系统,通常由多个相互独立又彼此耦合的工作流环节构成,例如数据路由、文本分块、结果重排序、查询理解、查询扩展、上下文融合、搜索优化等等。这些环节之间缺乏有机的整合,导致系统整体脆弱性较高,维护和优化成本也居高不下。Pleias 团队正在尝试利用最新的训练技术,将 RAG 系统中的各个环节“模型化”,构建两个核心模型:一个负责数据预处理和知识库构建,另一个负责信息检索、内容生成和报告输出。这两个模型相互协作,共同完成 RAG 的全流程任务。这种方案,需要全新的模型架构设计、精细化的合成数据管线和定制化的强化学习奖励函数,是真正的技术创新和研究突破。通过“模型化” RAG 系统,可以极大地简化系统架构,提升系统性能和稳定性,降低部署和维护成本,最终实现 RAG 技术的规模化应用。
总而言之,“模型即产品”的核心理念在于“转移复杂性(Displacing Complexity)”。将原本需要在应用层解决的复杂问题,通过模型训练的方式,提前在模型层面进行处理和消化。模型在训练阶段,预先学习和适应各种复杂场景和极端情况,从而使得模型部署和应用变得更加简单高效。未来,AI 产品的核心价值,将更多地体现在模型本身,而非应用层的花哨功能和复杂工作流。模型训练者
暂无评论