首页能源头条推荐资讯详情

算力革命新篇: Cerebras上市大涨51%，背靠OpenAI撬动英伟达算力霸权

2026-06-04 18:05

发布者：冬天的蝉

来源：冬天的蝉

标签：AI算力芯片

纽约/旧金山，2026年5月16日当地时间5月14日，AI芯片领域的"黑马"企业Cerebras Systems在纳斯达克挂牌交易，股票代码CBRS。尽管上市首日盘中一度暴涨108%触发熔断，最终收盘涨幅回落至68%，但截至5月16日收盘，该公司股价仍较185美元的发行价大涨51%，市值达602亿美元，成为2026年全球最大IPO，募资规模高达55.5亿美元，打破了Uber以来美国科技行业的IPO纪录。

这家专注于"晶圆级引擎"技术的芯片公司，凭借与OpenAI价值超200亿美元的战略合作协议，正以独特的技术路线向英伟达长达十年的AI算力垄断发起挑战，引发全球科技产业对AI基础设施变革的深度思考。

01二十倍超额认购，定价屡创新高

Cerebras的IPO之路堪称现象级。公司最初设定的发行价区间为115-125美元，后因市场需求火爆上调至150-160美元，最终定价185美元，超出上调后区间上限16%。据承销商透露，本次IPO获得了超过20倍的超额认购，吸引了包括主权财富基金、对冲基金和科技巨头在内的全球顶级投资者参与。

"这不仅仅是一次IPO，更是市场对AI算力架构变革的投票。" 摩根士丹利科技行业分析师Michael Ng表示，"Cerebras的估值已经超越了传统芯片公司的范畴，投资者看重的是其在AI推理领域的颠覆性潜力。"

Cerebras的上市募资规模达到55.5亿美元，若承销商行使超额配售权，总额将高达6.38亿美元。这一数字远超2025年芯片行业最大IPO——Arm的51亿美元，也让Cerebras成为继Snowflake（2020年）之后美国科技行业最大的IPO案例。值得注意的是，Cerebras目前仍处于亏损状态，2025年营收约为5.1亿美元，净亏损达12亿美元。但投资者显然更看重其增长潜力：自2026年1月与OpenAI达成合作以来，公司订单量增长了370%，2026年第一季度营收同比增长215%。

02 晶圆级引擎，重新定义AI计算

Cerebras的核心竞争力在于其独创的Wafer Scale Engine（WSE）晶圆级引擎技术，这与英伟达采用的多GPU集群方案形成鲜明对比。传统GPU芯片仅占晶圆面积的一小部分，而Cerebras将整个12英寸晶圆制成单一芯片，面积相当于约56个传统GPU，集成了1.2万亿个晶体管，拥有188GB的片上内存，带宽高达24PB/s。

"这不是简单的芯片尺寸放大，而是计算架构的革命。"Cerebras首席技术官Sean Lie解释道，"传统GPU集群需要通过网络传输数据，而我们的WSE-3芯片将所有计算和存储集成在单一晶圆上，消除了数据移动瓶颈，这是实现超低延迟推理的关键。"

图片来源:《Cerebras WSE-3 vs Nvidia H100/H200/B200: 详细技术对比 —— 谁才是 AI 时代真正的 “芯片之王“》

实测数据显示，Cerebras的CS-3系统在AI推理任务上展现出压倒性优势：

在Llama 3.3 70B模型推理中，CS-3速度达2140 tokens/秒，而英伟达旗舰DGX B200仅为120 tokens/秒，快18倍;

在GPT-OSS-120B模型上，实现3000 tokens/秒的推理速度，是GPU方案的15倍;总体拥有成本（TCO）比DGX B200低32%，功耗降低33%。

这种性能优势在实时应用场景中尤为关键。例如，在OpenAI的Codex-Spark代码生成服务中，基于Cerebras算力的版本能够实现"打字即响应"的体验，延迟从GPU方案的数百毫秒降至数十毫秒，使开发者的工作效率提升40%以上。

03 OpenAI 200亿美元押注，重塑算力格局

Cerebras敢于挑战英伟达，背后离不开OpenAI的强力支持。2026年1月，双方宣布达成一项具有里程碑意义的合作协议：OpenAI承诺在未来数年内支付超过200亿美元采购Cerebras的AI算力容量（约750兆瓦），并联合进行AI模型与硬件的协同设计。此外，OpenAI还向Cerebras提供了10亿美元的营运资金贷款，以支持其算力基础设施建设。

"这不是简单的供应商关系，而是战略级的技术协同。"OpenAI基础设施副总裁Sachin Katti表示，"Cerebras为我们提供了专用的低延迟推理解决方案，意味着更快的响应速度、更自然的交互体验，以及将实时AI扩展到更多用户的坚实基础。"这项合作的核心在于解决AI产业的"推理瓶颈"。随着大模型参数突破万亿级别，推理成本已占AI总支出的60%以上，成为制约AI应用普及的关键因素。OpenAI的ChatGPT目前周活跃用户超9亿，推理成本巨大，而Cerebras的技术能够将每token成本降低32%，同时将延迟降低90%以上。

具体部署将分阶段进行：2026年下半年开始，Cerebras将为OpenAI提供首批150兆瓦算力，主要用于Codex系列产品；2027年扩展至400兆瓦，支持GPT-5系列的实时推理；2028年全面部署750兆瓦，覆盖OpenAI所有核心服务。这将成为全球最大规模的高速AI推理部署，足以支持每秒处理超过10亿个token的请求量。

04 差异化竞争，撕开垄断裂缝

Cerebras的崛起恰逢AI算力市场格局剧变的关键节点。长期以来，英伟达凭借CUDA软件生态和高性能GPU，占据了AI训练市场90%、推理市场80%的份额，2026财年营收达2159亿美元，是Cerebras的423倍。但Cerebras并未选择正面竞争，而是通过差异化定位寻找突破口。

"我们不是要取代英伟达，而是要填补市场空白。"Cerebras首席执行官Andrew Feldman表示，"英伟达在训练和通用计算领域的优势无可替代，但在超大规模、低延迟推理场景，我们的技术路线更具优势。"这种差异化战略已初见成效。除OpenAI外，Cerebras还与AWS达成战略合作，为其提供专用推理算力；与Core42（原G42）合作部署OpenAI的GPT-OSS-120B模型，为企业客户提供每秒3000 tokens的推理服务。在金融、医疗等对实时性要求极高的行业，Cerebras的解决方案已开始替代部分GPU集群。

例如，摩根大通采用Cerebras系统处理高频交易数据，将风险评估响应时间从2秒缩短至0.1秒，同时降低了40%的算力成本；梅奥诊所利用Cerebras加速医学影像分析，使AI辅助诊断的周转时间从4小时降至15分钟，提升了紧急病例的救治效率。

05 生态构建与产能爬坡

尽管市场前景广阔，Cerebras仍面临多重挑战。最核心的问题在于软件生态构建——英伟达的CUDA平台已积累15年，拥有90%的AI开发者用户基础，而Cerebras的软件开发工具链仍在完善中。此外，晶圆级芯片的生产良率和供应链稳定性也是长期考验。

"生态系统是英伟达最坚固的护城河。"SemiAnalysis分析师Myron Xie指出，"Cerebras需要吸引更多开发者为其平台优化模型，这需要时间和持续投入。"产能方面，Cerebras目前依赖台积电的先进工艺，晶圆级芯片的生产难度远超传统GPU，良率控制是关键。据行业消息，Cerebras WSE-3的良率已从早期的30%提升至75%，但仍低于传统芯片的90%以上水平。面对挑战，Cerebras正加速构建生态系统。公司近期推出了Model Zoo计划，提供100多个主流大模型的WSE优化版本；同时与Hugging Face合作，简化模型迁移流程。此外，Cerebras还计划在2027年推出WSE-4芯片，集成2.4万亿个晶体管，性能将再提升一倍。

反馈举报

声明：以上信息仅代表发布者自身观点，并不代表本平台赞同其观点，也不代表本平台对其真实性负责。

网友评论仅供其表达个人看法，并不表明平台立场。

全部评论

加载更多

加载失败

冬天的蝉

总发布：416粉丝：0

算力革命新篇: Cerebras上市大涨51%，背靠OpenAI撬动英伟达算力霸权

相关推荐