近年来,大语言模型如ChatGPT在AI领域引发了新一轮变革。这些强大的模型不仅能理解人类指令,还能规划任务、探索环境并利用工具解决复杂问题,展现出在机器人、个人助理和流程自动化等多个领域的巨大潜力。

image.png

然而,当前大多数AI智能体系统较为被动,只有在接收到明确的人类指令时才会执行任务。例如,想要安排一个会议,还需手动输入时间、地点和参会人员,过程繁琐至极。

想象一下,如果你收到一封建议召开会议的电子邮件,一个被动的AI智能体只会等待你的指示。而一个主动的AI智能体则会注意到这封邮件,并主动提出安排会议。这种主动性不仅减轻了用户负担,还能挖掘出人类未明确表达的潜在需求。

image.png

为解决AI助手过于被动的问题,清华大学与面壁智能合作,研发出了一种全新的AI智能体。这个智能体不再仅仅听从指令,而是能“预见未来”,在你尚未开口时,便主动为你安排好一切。

这个神奇的AI智能体是如何实现的呢?关键在于ProactiveBench数据集。这个数据集犹如一本记录人类活动的“百科全书”,详细记录了你在电脑前的每一次敲击、点击和复制粘贴操作。

image.png

研究人员利用这个数据集训练了一个奖励模型,它犹如一个模拟人类大脑的超级计算机,能够判断AI智能体的行为是否符合人类预期。表现优秀的AI智能体会获得奖励,反之则会被扣分。经过不断训练,AI智能体能够根据用户行为预测需求,并在关键时刻提供帮助。

例如,当你收到一封建议召开会议的邮件,这个“预见未来”的AI智能体将自动识别内容,并询问你是否需要安排会议。若你同意,它将自动为你安排时间、地点,并发送会议邀请,比现有AI助手更为智能。

实验结果显示,采用ProactiveBench数据集训练的AI智能体表现卓越,例如,Qwen2-7B-Instruct模型在主动提供帮助方面的F1得分高达66.47%,超越了所有开源和闭源模型。

虽然这个“预见未来”的AI智能体尚处于研究阶段,但它为未来人机协作的发展带来了新希望。相信不久的将来,我们将拥有一个真正“懂你”的AI助手,它不仅能听从指令,还能主动解决各种问题,让生活变得更加轻松便捷。

论文地址:https://arxiv.org/pdf/2410.12361