OpenAI在为期12天的技术分享直播活动落幕之际,发布了其下一代推理模型o3。这是继先前推出的o1推理模型后的更新版。o3系列包括o3和o3-mini两个版本,其中o3-mini是一个针对特定任务进行微调的更小巧的精简版模型。OpenAI透露,在某些情况下,o3模型有望接近实现通用人工智能(AGI),即能够执行人类能够完成的任何任务的人工智能。

在ARC-AGI图形逻辑推理基准测试中,o3模型创造了新的记录,低计算场景下的得分达到75.7%,而高计算测试中的得分高达87.5%,超过了人类水平标志的85%。相比之下,o1模型的得分仅在25%到32%之间,o3的表现几乎是o1的三倍。在全球知名的编码竞赛平台Codeforces上,o3的得分达到2727,而o1的得分仅为1891。

微信截图_20241223134833.png

猎豹移动猎户星空董事长傅盛表示,OpenAI的o3发布预示着一个新纪元的到来,即每个人都能成为程序员。用户无需精通Python或C语言,只需提出需求,大预言模型就能协助完成编程任务。傅盛认为,o3的发布意味着大语言模型的编程能力已超越99.9%的程序员,在Codeforces世界级编程比赛中,o3取得了第175名的顶尖成绩,而o1大约战胜了90%的程序员,之前GPT-4o仅战胜了11%的程序员。

OpenAI计划于明年1月底正式发布o3模型。傅盛强调,尽管程序员不会完全消失,但他们的工作将更多转向理解用户需求和大逻辑构建,而将需求转化为代码的工作将主要由AI完成。这一发布预示着AI在编程领域的应用将更为广泛,并可能改变程序员的工作模式。