谷歌DeepMind新团队研发模拟物理世界AI

谷歌近期宣布,将组建一支全新团队,专注于研发能模拟现实物理世界的人工智能(AI)模型。该团队由曾在OpenAI负责视频生成模型Sora的共同负责人Tim Brooks领导。Brooks在社交平台X上透露,这个新团队将隶属于谷歌AI研究实验室Google DeepMind。

Brooks在其公告中指出:“DeepMind的计划目标远大,旨在开发大规模生成模型以模拟现实世界。”他还提到,团队将与谷歌的Gemini、Veo和Genie团队紧密合作,解决“关键新问题”,并将模型规模扩展至最大计算能力。其中,Gemini是谷歌旗舰级AI模型系列,主要用于图像分析和文本生成;Veo是谷歌自主的视频生成模型;而Genie则是谷歌的世界模型尝试,能够实时模拟游戏和3D环境。

据Brooks所述,该团队将研发“实时互动生成”工具,并研究如何将模型与现有的多模态模型如Gemini进行整合。工作描述中提到:“我们相信,基于视频和多模态数据的AI训练规模化是实现人工通用智能(AGI)的关键路径。”AGI指的是能够完成任何人类能完成的任务的人工智能。

众多初创公司和大型科技企业也在积极投身于世界模型的研发,如由知名AI研究员Fei-Fei Lee主导的World Labs、以色列初创企业Decart和Odyssey等。这些公司认为,未来世界模型可用于创造互动媒体,如视频游戏和电影,以及运行训练机器人等真实模拟。

然而,在创意领域,这项技术引发了不同的看法。最近一项《连线》杂志的调查显示,游戏开发公司如动视暴雪正在利用AI节省成本、提高生产效率,但也导致大量员工失业。根据2024年动画工会的一项研究,预计到2026年,美国电影、电视和动画行业将有超过10万个工作岗位受到AI的影响。

尽管如此,一些新兴的世界建模初创企业如Odyssey承诺将与创意专业人士合作,而不是取代他们。谷歌是否会采取类似做法,仍有待观察。此外,关于版权的问题也尚未得到解决。部分世界模型的训练可能使用了未经授权的视频游戏实况片段,导致相关公司面临诉讼风险。

谷歌声称其在YouTube上训练模型是根据平台的服务条款获得了许可,但尚未透露具体使用了哪些视频。

相关推荐

暂无评论

发表评论