最近,谷歌与 OpenAI 之间的竞争愈演愈烈。在新版 GPT-4o 刚刚取得 AI 领域的领先地位后仅一天,谷歌便发布了最新的测试版模型 Gemini-Exp-1121,并迅速重新夺回了冠军位置。这一动态表明,谷歌对 OpenAI 的动作反应极为敏锐,因为就在一周之前,谷歌才推出了 Gemini-Exp-1114。
谷歌 DeepMind 的首席科学家 Jack Rae 表示,这是一场“闪电战”,暗示着后续训练的迭代速度优于预训练阶段。
根据官方数据,Gemini-Exp-1121在多个领域有所突破,特别是在代码处理能力、推理能力和视觉理解能力方面。此外,该模型在复杂提示词的风格控制上,已达到了与当前顶尖的 o1-preview 和 New Sonnet3.5相媲美的水平。
实际测试表明,Gemini-Exp-1121在漫画理解方面的表现超越了新版 GPT-4o,提供的回复更加全面,能够清晰地使用小标题和重点加粗的方式进行信息传达。而在经典的动物过河的逻辑推理题中,Gemini-Exp-1121的回答完全正确,展现出更强的逻辑推理能力,相较之下,新版 GPT-4o 出现了一些错误。
与此同时,OpenAI 也在积极开发新功能,近期在最新版本的 ChatGPT 中发现了“实时摄像”(Live Camera)视频功能的代码,这标志着其在语音和视觉识别技术上的进步。OpenAI 用户在使用高级语音模式时,首次体验到这一新能力,表明其未来有意扩大此功能的应用范围。
可以预见,明年与 Chatbot 的主要交流方式可能会从传统的文字聊天逐步转向语音和更智能的代理服务,而这一转变或将由“实时摄像”功能的推出引领。
重要信息:
📈 谷歌新模型 Gemini-Exp-1121 在 GPT-4o 登顶后迅速反超,再次登顶 AI 竞赛榜。
🔍 Gemini-Exp-1121 在代码、推理和视觉理解能力上均有所提升,表现优异。
🎥 OpenAI 正在研发“实时摄像”功能,未来或将革新与 AI 的互动方式。
暂无评论