最近,斯坦福大学、华盛顿大学和谷歌 DeepMind 的研究团队联合开发了一种先进的人工智能(AI)智能体。这些智能体可以在社交实验中精确模拟人类的行为。根据研究成果,这种模拟技术将为经济学、社会学、组织学和政治学等领域的理论研究提供实验基础。

image.png

在构建这些 AI 智能体的过程中,研究人员分析了超过1,000名美国选民的访谈数据。这些受访者的年龄、性别、教育背景和政治观点多样,反映了美国社会的广泛性。AI 智能体通过对访谈记录进行分析,并采用 GPT-4o 模型,在接收到用户提问时,能够重现受访者的真实反应。

具体而言,研究团队对每位参与者进行了长达两小时的深度访谈,随后利用 OpenAI 的 Whisper 模型将访谈内容转化为文本。这一方法显著提升了 AI 智能体的精准性。在对人类行为进行预测测试时,基于访谈数据的 AI 智能体以85%的准确率成功预测了人类在普遍社会调查中的反应,远远超越了仅依赖基本人口统计信息的 AI 代理。

研究者们还开展了五项社会科学实验,结果显示四项实验中,AI 智能体产生的结果与人类参与者的反应高度一致,相关系数达到0.98。这一结果表明,基于访谈的数据方法在分析不同政治意识形态和种族群体的响应时,表现出更高的精准度和更良好的平衡性。

为了便于后续的研究,研究团队将创建的1,000个 AI 智能体的数据集上传至 GitHub,供其他科学家使用。为保障参与者的隐私,团队采用了双层访问系统。

image.png

科学家可自由获取特定任务的综合响应数据,而对开放式研究中个体响应数据的访问则需特别授权。该系统旨在保护原始访谈参与者的隐私,同时帮助研究人员更深入地研究人类行为。

项目入口: https://github.com/joonspk-research/genagents

重点关注:

🌟 研究团队开发的 AI 智能体基于访谈数据,能够精准模拟人类行为,提高社会科学研究的准确性。

📊 AI 智能体在社会调查中的预测准确率达到85%,明显优于仅依赖人口统计数据的智能体。

🔍 数据集已公开,其他研究人员可通过 GitHub 访问,以促进对人类行为的研究,并保护参与者隐私。