
新智元报道

【新智元导读】120B模型飙到2000 token/秒,CFO更放话已在跑GPT-5.5!Cerebras 560亿美元IPO首日暴涨68%,但SemiAnalysis万字拆解直指死穴。
SemiAnalysis,硅谷最硬核的芯片分析机构,4月份光是AI工具的订阅费就烧到了年化1000万美元。
其中80%花在同一个地方,Anthropic的Opus 4.6 fast模式。
它比标准模式贵6倍,但token输出速度快2.5倍!

然后Opus 4.7来了。更聪明,跑分全面碾压上一代,但工程师集体拒绝升级。
理由只有一个,4.7没有fast模式。
他们宁可用更笨的模型,也要更快的token!

而这个趋势的最大受益者,是一家刚刚以560亿美元估值登陆纳斯达克的芯片公司,Cerebras。
2000 token/秒,怎么来的
OpenAI今年2月甩出了GPT-5.3-Codex-Spark。
名字挂着GPT-5.3的招牌,但底层是一个从完整版GPT-5.3 Codex蒸馏出来的小模型,参数量只有原版的十分之一,120B。
虽然是用智能换来的,但速度确实夸张到离谱——2000 token/秒。
作为对比,Anthropic最快的Opus 4.6 fast大约70-100 token/秒,GPT-5系列在英伟达GPU上是大约130 token/秒。
而Codex-Spark一脚油门踩到了一个数量级开外。

让它跑这么快的,正是Cerebras的WSE-3,一块餐盘大小的晶圆级芯片。
这件事直接引爆了一笔246亿美元的合同,也把Cerebras一路推进了纳斯达克。5月14日首日暴涨68%,2026年至今最大科技IPO。
但Cerebras CFO Bob Komin说,这还只是开胃菜。
IPO前夜,他在采访中亮了一张没人预料到的牌——
我们服务所有模型,对模型大小没有限制。今天,我们正在跑万亿参数的模型。我们正在跑OpenAI内部的GPT-5.4和GPT-5.5。
如果这是真的,Cerebras就不只是一个「小模型快跑」的玩家了,IPO当天的疯狂涨幅立刻站得住脚。

本文转自:凤凰网科技
原文地址: https://tech.ifeng.com/c/8tESuwrFZeq

小同爱分享14 天前
命没了还有轮回,钱没了,死都不甘心。 - 小同爱分享
小同爱分享3 个月前
疫情,就是让人抑郁,又没了感情。 - 小同爱分享