
新智元报道
编辑:桃子 KingHZ
【新智元导读】年终AI大戏,OpenAI败给了谷歌?GPT-5.2上线48小时,全网吐槽一大片。第三方数据实证,Gemini 3 Pro才是真正的王者。
OpenAI打出了GPT-5.2这张「年度王牌」,却没有打赢谷歌...

Epoch AI最新报告,GPT-5.2的能力指数(ECI)得分152,仅次于Gemini 3 Pro。

在多项基准测试中,GPT-5.2的实力并没有「全线霸榜」。
在由陶哲轩联手百位数学家出的考题——FrontierMath中,GPT-5.2仅在T1-3级中霸榜,T4还是Gemini 3的高地。
另外,在国际象棋Chess Puzzles中,GPT-5.2拿下了第一的成绩。
唯一例外的是,在SimpleQA Verified上,GPT-5.2都不及GPT-5.1,意味着迭代后的可信度更差了。

不仅如此,多个第三方基准评测显示,GPT-5.2远不及预期,没有打败Gemini 3。


包括OCR-Arena、simple-bench、Live-Bench上,GPT-5.2甚至都排在了Claude Opus 4.5之后。



发布仅两天,GPT-5.2水花不大,反而圈子里开发者吐槽的不少。
为了打赢这场硬仗,OpenAI拉响「红色警报」,把改进ChatGPT事项提到了优先级。
更极端的是,内部直接停掉了AGI的研发,Sora也暂停了八周,显然摆出了破釜沉舟的姿态。

可是呢,在业界来看,OpenAI至今仍未摆脱被动的局面。
GPT-5重度用户站出来发声,「GPT-5.2距离成为一块石头也不远了」。

年终之战,OpenAI败了?
三年前,谷歌因错失先机,被OpenAI ChatGPT抢尽了风头。
昨天,谷歌创始人谢尔盖·布林重返斯坦福演讲,现场公开承认曾经的「最大失误」:
我们搞砸了——太怕AI说错话,结果输掉一个时代。
本文转自:凤凰网科技
原文地址: https://tech.ifeng.com/c/8p4pHK3iyl5

小同爱分享22 小时前
俄罗斯方块告诉我们,合群就会消失,不合群就会失败。 - 小同爱分享
小同爱分享1 天前
一个半小时,居然是三个半小时。 - 小同爱分享