懂能帝首页 懂能帝首页
|
首页能源头条推荐资讯详情

算力革命新篇: Cerebras上市大涨51%,背靠OpenAI撬动英伟达算力霸权

2026-06-04 18:05
发布者:冬天的蝉
来源:冬天的蝉
标签:AI算力芯片
1
0
9
分享

纽约/旧金山,2026年5月16日 当地时间5月14日,AI芯片领域的"黑马"企业Cerebras Systems在纳斯达克挂牌交易,股票代码CBRS。尽管上市首日盘中一度暴涨108%触发熔断,最终收盘涨幅回落至68%,但截至5月16日收盘,该公司股价仍较185美元的发行价大涨51%,市值达602亿美元,成为2026年全球最大IPO,募资规模高达55.5亿美元,打破了Uber以来美国科技行业的IPO纪录。

这家专注于"晶圆级引擎"技术的芯片公司,凭借与OpenAI价值超200亿美元的战略合作协议,正以独特的技术路线向英伟达长达十年的AI算力垄断发起挑战,引发全球科技产业对AI基础设施变革的深度思考。

01二十倍超额认购,定价屡创新高

Cerebras的IPO之路堪称现象级。公司最初设定的发行价区间为115-125美元,后因市场需求火爆上调至150-160美元,最终定价185美元,超出上调后区间上限16%。据承销商透露,本次IPO获得了超过20倍的超额认购,吸引了包括主权财富基金、对冲基金和科技巨头在内的全球顶级投资者参与。

"这不仅仅是一次IPO,更是市场对AI算力架构变革的投票。" 摩根士丹利科技行业分析师Michael Ng表示,"Cerebras的估值已经超越了传统芯片公司的范畴,投资者看重的是其在AI推理领域的颠覆性潜力。"

Cerebras的上市募资规模达到55.5亿美元,若承销商行使超额配售权,总额将高达6.38亿美元。这一数字远超2025年芯片行业最大IPO——Arm的51亿美元,也让Cerebras成为继Snowflake(2020年)之后美国科技行业最大的IPO案例。值得注意的是,Cerebras目前仍处于亏损状态,2025年营收约为5.1亿美元,净亏损达12亿美元。但投资者显然更看重其增长潜力:自2026年1月与OpenAI达成合作以来,公司订单量增长了370%,2026年第一季度营收同比增长215%。

02 晶圆级引擎,重新定义AI计算

Cerebras的核心竞争力在于其独创的Wafer Scale Engine(WSE)晶圆级引擎技术,这与英伟达采用的多GPU集群方案形成鲜明对比。传统GPU芯片仅占晶圆面积的一小部分,而Cerebras将整个12英寸晶圆制成单一芯片,面积相当于约56个传统GPU,集成了1.2万亿个晶体管,拥有188GB的片上内存,带宽高达24PB/s。

"这不是简单的芯片尺寸放大,而是计算架构的革命。"Cerebras首席技术官Sean Lie解释道,"传统GPU集群需要通过网络传输数据,而我们的WSE-3芯片将所有计算和存储集成在单一晶圆上,消除了数据移动瓶颈,这是实现超低延迟推理的关键。"

图片来源:《Cerebras WSE-3 vs Nvidia H100/H200/B200: 详细技术对比 —— 谁才是 AI 时代真正的 “芯片之王“》

实测数据显示,Cerebras的CS-3系统在AI推理任务上展现出压倒性优势:

在Llama 3.3 70B模型推理中,CS-3速度达2140 tokens/秒,而英伟达旗舰DGX B200仅为120 tokens/秒,快18倍;

在GPT-OSS-120B模型上,实现3000 tokens/秒的推理速度,是GPU方案的15倍;总体拥有成本(TCO)比DGX B200低32%,功耗降低33%。

这种性能优势在实时应用场景中尤为关键。例如,在OpenAI的Codex-Spark代码生成服务中,基于Cerebras算力的版本能够实现"打字即响应"的体验,延迟从GPU方案的数百毫秒降至数十毫秒,使开发者的工作效率提升40%以上。

03 OpenAI 200亿美元押注,重塑算力格局

Cerebras敢于挑战英伟达,背后离不开OpenAI的强力支持。2026年1月,双方宣布达成一项具有里程碑意义的合作协议:OpenAI承诺在未来数年内支付超过200亿美元采购Cerebras的AI算力容量(约750兆瓦),并联合进行AI模型与硬件的协同设计。此外,OpenAI还向Cerebras提供了10亿美元的营运资金贷款,以支持其算力基础设施建设。

"这不是简单的供应商关系,而是战略级的技术协同。"OpenAI基础设施副总裁Sachin Katti表示,"Cerebras为我们提供了专用的低延迟推理解决方案,意味着更快的响应速度、更自然的交互体验,以及将实时AI扩展到更多用户的坚实基础。"这项合作的核心在于解决AI产业的"推理瓶颈"。随着大模型参数突破万亿级别,推理成本已占AI总支出的60%以上,成为制约AI应用普及的关键因素。OpenAI的ChatGPT目前周活跃用户超9亿,推理成本巨大,而Cerebras的技术能够将每token成本降低32%,同时将延迟降低90%以上。

具体部署将分阶段进行:2026年下半年开始,Cerebras将为OpenAI提供首批150兆瓦算力,主要用于Codex系列产品;2027年扩展至400兆瓦,支持GPT-5系列的实时推理;2028年全面部署750兆瓦,覆盖OpenAI所有核心服务。这将成为全球最大规模的高速AI推理部署,足以支持每秒处理超过10亿个token的请求量。

04 差异化竞争,撕开垄断裂缝

Cerebras的崛起恰逢AI算力市场格局剧变的关键节点。长期以来,英伟达凭借CUDA软件生态和高性能GPU,占据了AI训练市场90%、推理市场80%的份额,2026财年营收达2159亿美元,是Cerebras的423倍。但Cerebras并未选择正面竞争,而是通过差异化定位寻找突破口。

"我们不是要取代英伟达,而是要填补市场空白。"Cerebras首席执行官Andrew Feldman表示,"英伟达在训练和通用计算领域的优势无可替代,但在超大规模、低延迟推理场景,我们的技术路线更具优势。"这种差异化战略已初见成效。除OpenAI外,Cerebras还与AWS达成战略合作,为其提供专用推理算力;与Core42(原G42)合作部署OpenAI的GPT-OSS-120B模型,为企业客户提供每秒3000 tokens的推理服务。在金融、医疗等对实时性要求极高的行业,Cerebras的解决方案已开始替代部分GPU集群。

例如,摩根大通采用Cerebras系统处理高频交易数据,将风险评估响应时间从2秒缩短至0.1秒,同时降低了40%的算力成本;梅奥诊所利用Cerebras加速医学影像分析,使AI辅助诊断的周转时间从4小时降至15分钟,提升了紧急病例的救治效率。

05 生态构建与产能爬坡

尽管市场前景广阔,Cerebras仍面临多重挑战。最核心的问题在于软件生态构建——英伟达的CUDA平台已积累15年,拥有90%的AI开发者用户基础,而Cerebras的软件开发工具链仍在完善中。此外,晶圆级芯片的生产良率和供应链稳定性也是长期考验。

"生态系统是英伟达最坚固的护城河。"SemiAnalysis分析师Myron Xie指出,"Cerebras需要吸引更多开发者为其平台优化模型,这需要时间和持续投入。"产能方面,Cerebras目前依赖台积电的先进工艺,晶圆级芯片的生产难度远超传统GPU,良率控制是关键。据行业消息,Cerebras WSE-3的良率已从早期的30%提升至75%,但仍低于传统芯片的90%以上水平。面对挑战,Cerebras正加速构建生态系统。公司近期推出了Model Zoo计划,提供100多个主流大模型的WSE优化版本;同时与Hugging Face合作,简化模型迁移流程。此外,Cerebras还计划在2027年推出WSE-4芯片,集成2.4万亿个晶体管,性能将再提升一倍。

声明:以上信息仅代表发布者自身观点,并不代表本平台赞同其观点,也不代表本平台对其真实性负责。
评论 0
网友评论仅供其表达个人看法,并不表明平台立场。
全部评论
懂能帝AI助手
服务商入驻
服务商入驻
资讯投稿
资讯发布
视频发布
视频发布
在线客服
平台客服