近期,Verses 团队研发的 Genius 智能体在经典游戏 Pong 中取得了令人瞩目的成绩。凭借仅10%的训练数据和2小时的训练时间,Genius 智能体便超越了顶尖人类玩家及其他 AI 模型,这一成就标志着 AI 技术发展的新高度,预示着未来智能体的发展趋势。

Genius 智能体的成功得益于其独特的设计理念。与传统的大型模型相比,Genius 的规模仅为 SOTA 模型 IRIS 的4%,且能在普通的 M1芯片的 MacBook 上运行。这一设计灵感源于四年前的一项实验,当时科学家们发现培养的“盘中大脑”仅需5分钟便能学会 Pong 游戏,这激发了他们关于模仿人脑工作方式的思考。

机器人 人工智能 AI

图源说明:该图片由AI生成,图片授权服务商为Midjourney

Verses 团队认为,传统的基于大模型的 AI 智能体在逻辑推理方面存在明显不足。现有模型主要依赖记忆训练数据中的推理步骤,缺乏主动性和好奇心。而 Genius 智能体引入了认知引擎的概念,不仅具备认知、推理和决策能力,还赋予智能体主动学习的能力。

在与 IRIS 和其他 AI 模型的对比测试中,Genius 智能体展现出了强大的学习能力。研究者在2小时内用1万步的游戏数据对 Genius 进行了训练,结果显示其表现优于训练两天的 IRIS。Genius 的成功不仅在于快速学习能力,还在于其在游戏中的主动表现。例如,在 Pong 比赛中,Genius 即使在落后情况下也能逆转获胜,这在 IRIS 的训练中未曾出现。

然而,研究者们也指出,尽管 Genius 的表现令人振奋,但目前尚无统一标准来全面衡量 AGI 的表现,因此需要进行多样化测试来验证其在不同领域的适应性和可靠性。

这一研究成果不仅推动了 AI 智能体的发展,也为未来机器智能探索提供了新的思路和方法。

论文链接:https://arxiv.org/pdf/2410.05229