中国首家AIIDE编程软件下载,体验DeepSeek-R1和Doubao-pro!

🚀体验邀请:中国首发的 AI IDE 智能编程软件 Trae 中文版,免费下载!不限量使用 DeepSeek-R1 和 Doubao-pro!

本周,智能体(Agent)技术在科技领域迅速兴起,这得益于推理模型能力的显著提升。

3月5日晚,Manus 引人注目地亮相,其强大的演示瞬间引发全网热议。两天后,国内团队 DeepWisdom MetaGPT 和 CAMEL AI 分别发布了开源项目 OpenManus 和 OWL,迅速复制了 Manus 的关键功能,再次点燃了网络和 GitHub 社区的热情,并引发了广泛讨论。


(adsbygoogle=window.adsbygoogle||[]).push({});

特别值得关注的是,OpenManus 团队凭借 MetaGPT 长期积累的技术实力,仅用 1 小时便搭建了核心系统,并在短短 3 小时内完成项目上线。这一惊人速度不仅使 OpenManus 在 GitHub 上迅速获得过万 Star,也使其成为行业内外关注的焦点。

3月8日上午,锦秋基金邀请 OpenManus 团队的三位核心成员进行深度分享,旨在分析 OpenManus 的技术实现原理,并探讨 Agent 技术的未来发展趋势。

 

本次分享的三位嘉宾都是 Agent 领域的资深专家:洪思睿,MetaGPT 论文(ICLR 2024 Oral)与数据解释器(Data Interpreter)论文的第一作者,同时也是 AFLOW 论文(ICLR 2025 Oral)的作者之一,其研究成果多次在国际顶级学术会议和期刊上发表。梁新兵,OpenManus 的核心开发者。向劲宇,OpenManus 的合作者,同时也是 AFlow 和 SPO 的第一作者。

 

在分享中,三位嘉宾对 Agent 技术的未来发展方向,以及行业面临的挑战,提出了以下前瞻性思考:

  • 随着大型语言模型(LLM)能力的持续增强,Agent 在多个领域的应用成功率将显著提升,尤其是在 QA 问答、HumanEval 代码能力评测和 MBPP Python 编程问题这类相对标准化的任务上,单一模型已经能够展现出卓越的解决能力。
  • 然而,现实世界中存在大量复杂且具有长尾效应的问题,例如复杂的机器学习任务、代码缺陷修复,以及需要整合多方信息才能为用户提供有效答案的搜索组合问题。这些问题仍然需要大量的技术创新来提升 Agent 的表现,尤其是在解决模型“幻觉”问题方面。
  • Agent 在任务规划能力上的进步,既依赖于模型自身能力的提升,也离不开外部结构的辅助。更精巧的架构设计,能够帮助 Agent 更好地理解和分解复杂任务。
  • 随着 Agent 可使用的工具种类日益丰富,如何让 Agent 在面对同一任务时,从众多功能相似的工具中做出精准决策,选择最合适的工具,并避免错误选择,将成为新的技术挑战。
  • Agent 的记忆管理,核心问题在于如何在成本和效率之间找到平衡。直接使用完整的记忆信息,虽然当前的模型可以处理,但会导致处理时间和成本显著增加,严重影响用户体验,而非性能下降。
  • 目前,解决记忆管理问题的一种有效方法是采用多智能体架构或工具辅助策略。例如,OpenManus 等框架通常会利用规划工具预先生成任务计划,将复杂任务分解为多个子任务,每个子任务之间的记忆不完全共享,并在任务执行完毕后进行总结或压缩处理,从而降低计算成本。
  • 虽然在基准测试中,我们能够明确判断 Agent 是否正确完成了任务,但在实际应用场景中,如何量化评估 Agent 完成任务的准确性或质量,仍然是一个难题。
  • Agent 商业化的关键在于能否将真实场景中的任务和用户需求做到极致,包括提供高度个性化的功能,只有这样才能吸引用户

相关推荐

暂无评论

发表评论