OpenAI 的 GPT-4.5模型一经发布,便在短短六小时内荣登人工智能竞赛的榜首,成为全能分类的第一名。但这份荣光并未长久,马斯克的 xAI Grok-3模型迅速崛起,超越了GPT-4.5,重返总榜首位。
根据投票数据,GPT-4.5与Grok-3均收获了超过3000票,总分分别是1412和1411,仅有一票之差。尽管GPT-4.5在多数项目上表现优异,但Grok-3在“风格控制”和“困难提示词”等特定任务上略占上风,这成为了其反超的关键。
针对这场“六小时逆袭”,许多用户表达了质疑,认为如此之快的变化是否合理。业界人士解释称,榜单设有投票门槛,只有在同一时段内获得3000票的模型才能上榜。因此,这两款新发布不久的模型同时达标,纯属偶然。
值得一提的是,尽管GPT-4.5初露锋芒时遭遇了一些负面评价,但其情商之高却在后续得到了用户的高度认可。OpenAI的首席执行官萨姆・奥尔特曼甚至公开分享了自己与GPT-4.5的对话,并表示这是他首次收到用户请求承诺不将其下架。
GPT-4.5还参加了另一场独特的竞赛,类似于“大模型狼人杀”。在这个游戏中,各个AI模型需要辩论、策略制定和投票,胜者由淘汰成员组成的陪审团决定。GPT-4.5在协作、欺诈和策略制定等方面表现非凡,甚至超越了人类。
这一切都说明,人工智能的竞争日趋激烈,各模型在各自的领域中不断革新和进步。未来,究竟谁能在这场智能之战中脱颖而出,值得我们持续关注。
暂无评论