懂能帝首页 懂能帝首页
|
首页能源头条推荐资讯详情

趋势丨AI推理的未来方向是全系统运算解决方案

2026-04-13 18:34
发布者:往事随風
来源:往事随風
标签:芯片
0
0
0
分享

从单一芯片到机架级基础设施

什么是“全系统运算解决方案”?它意味着AI推理的竞争不再围绕单一芯片的算力参数展开,而是转向覆盖加速器、网络、内存互联、软件栈乃至整个机架的端到端能力。这起收购建立在双方始于2025年的合作基础上,旨在增强d-Matrix提供系统级AI基础设施而非离散硅片的能力。

GigaIO开发的可组合基础设施FabreX,基于PCIe标准的可组合内存结构,支持跨节点构建解耦的计算与内存池,能在机架或集群级别进行动态配置。这项技术与d-Matrix原有的Corsair推理加速器、JetStream网络和Aviator软件,以及同博通、Arista联合开发的SquadRack机架级参考架构形成完整闭环。从更宏观的产业视角看,全系统方向已成为头部企业的共识。2026年GTC大会上,英伟达产品形态已从单一GPU升级为“芯片—机架—数据中心”一体化系统,标志着算力竞争重心跃迁至数据中心级平台。d-Matrix的收购战略与这一趋势完全同频。

d-Matrix的前瞻判断:内存带宽才是真正的瓶颈

d-Matrix选择了一条与GPU阵营截然不同的技术路径。当英伟达2019年在AI训练领域确立统治地位后,创始人Sheth没有押注训练芯片,而是聚焦推理。“除非你有实质性的差异化,否则尝试在那里做些什么将是愚蠢的差事。”

d-Matrix的核心判断是:对于基于Transformer的推理,瓶颈从来不是计算,而是移动权重。数据在计算核心与内存之间的搬运构成了核心延迟来源。为此,他们研发了数字内存计算技术——矩阵乘法直接在内存单元内发生,内存块本身充当计算块,通过嵌入式加法器树完成求和运算,为AI推理提供更高效的硬件解决方案。该平台基于SRAM而非HBM,专为Transformer工作负载定制,Corsair在芯片内部配置了大容量SRAM与LPDDR5X,让矩阵运算尽可能靠近存储发生,从而降低数据搬运的能耗与延迟。此外,d-Matrix还规划了3D DRAM内存堆叠创新,将内存容量扩展至3D维度,承诺相比当前行业标准HBM4,能够将AI模型运行速度提升10倍,并将能耗降低高达90%。

这种从底层架构层面的重构,体现的是对推理场景本质需求的深刻洞察。正如d-Matrix所表达的,他们将考虑“三个主要的障碍”来实现快速、高效、高性能的AI推理,而内存带宽正是其中最核心的一道壁垒。Sheth的表述清晰地阐明了全系统方向的演进逻辑:“我们知道需要一些特殊的东西,一些更高效的东西,不仅仅解决计算问题,还要解决计算、内存、内存带宽、内存容量以及所有这些问题。”

市场信号:融资节奏与客户卡位

d-Matrix的全系统路线获得了资本的强烈认可。2025年11月,公司完成2.75亿美元C轮融资,估值达20亿美元,累计融资4.5亿美元,参与方包括欧洲科技投资公司Bullhound Capital、新加坡主权财富基金淡马锡等,微软旗下风险投资基金M12、卡塔尔投资局和EDBI也参与了本轮投资。这些顶级投资机构的入局,是对d-Matrix技术路线和商业前景的有力背书。

产品层面,Corsair平台性能参数已相当亮眼。在Llama 70B模型上可实现3万Token/秒的吞吐量、每Token仅2毫秒延迟;在Llama 8B模型上,单台服务器即可实现6万Token/秒、每Token 1毫秒的极致性能。此外,据称其方案相比使用HBM的替代方案,在性能模式下可将交互式延迟降低高达10倍。Sheth声称其解决方案在成本、能效和速度上分别优于GPU 2-3倍、5-10倍和近10倍。

目标客户覆盖超大规模云厂商、前沿AI实验室和企业级部署。超级计算机等合作伙伴正在将d-Matrix方案推向市场。Sheth预计收购将加速收入节奏,并在异构系统的机架配置中支撑新的定价模式。

AI推理的拐点时刻与全系统路径的战略意义

这笔收购之所以值得关注,根本上是因为AI产业的需求结构正在发生根本性转变。德勤预计,全球推理负载占AI算力的比例将从2023年的约三分之一提升至2026年的约三分之二。英伟达更是指出,过去两年全球算力需求因推理任务快速增长达100万倍。

正是在这一结构性拐点面前,全系统运算解决方案展现出独特优势。当推理工作负载日益分布式化、异构化地跨CPU、GPU和推理加速器运行时,数据必须在芯片、节点、机架和整个数据中心之间实时高效移动。拥有完整系统栈的企业能够提供更低延迟、更高能效和更具成本竞争力的方案。银河证券明确指出,算力竞争已从芯片层跃迁至数据中心级平台。d-Matrix CEO Sheth的表达最为精准:“推理大于任何单一芯片。它现在是一个系统问题。”

结语:

从GigaIO数据中心业务的收购,到数字内存计算技术的底层突破,再到推理算力需求的结构性爆发,一切趋势表明,AI推理的未来在于系统级的整体优化,而2026年的这场收购,不过是这场系统性竞赛刚刚拉开的序幕。

网络援引:

阿里云:《定义2026智算元年:解构企业级人工智能应用从“实验态”向“生产态”转型的底层协议》

智通财经:《广发证券:AI推理效率革新与Agent共振 打开万亿市场空间》

新浪财经:《数字经济周报:GTC2026亮点 AI从芯片竞争迈向系统竞争》

中国科技网:《Token爆发元年!2026中关村论坛年会分论坛共话AI大规模推理服务新图景》

声明:以上信息仅代表发布者自身观点,并不代表本平台赞同其观点,也不代表本平台对其真实性负责。

大家都在看

广告
评论 0
网友评论仅供其表达个人看法,并不表明平台立场。
全部评论
懂能帝AI助手
服务商入驻
服务商入驻
资讯投稿
资讯发布
视频发布
视频发布
在线客服
平台客服