首页能源头条推荐资讯详情

热点丨500亿砸向算力基建，DeepSeek打响国产AI的地基争夺战

2026-06-17 18:21

发布者：冬天的蝉

来源：冬天的蝉

标签：芯片算力

从租算力到建算力,投入背后的成本账

2026年6月DeepSeek首轮融资细节曝光：拟募资约500亿元人民币，投后估值高达3500亿至4000亿元，这是中国AI领域有史以来最大规模的单轮融资之一。

据行业投资人预测，这笔资金中高达60%至70%，也就是300亿到350亿元，将直接流向算力基础设施建设。

在此之前，DeepSeek的算力供给主要依赖第三方云服务商，这种模式在模型研发初期足够灵活，但随着训练规模扩大和推理请求激增，短板正在快速显现。

按照业内测算，一个万卡级AI集群一年的租赁成本就在数十亿元量级。

而DeepSeek规划中的GW级算力中心，对应约50万张加速卡的规模，若全部采用租赁模式，每年的算力支出将是天文数字。

自建数据中心虽然前期投入巨大，但从三到五年的周期看，单位算力成本会显著低于租赁模式。

更深层的考量来自供应链安全，对于志在前沿模型研发的DeepSeek来说，算力供给的稳定性直接决定了产品迭代的速度。

自建算力中心相当于把发展的主动权握在自己手里，不用再看上游供应链的脸色。

从招聘信息透露的细节看，DeepSeek的基建团队已经在研究液冷、高密度供配电、模块化建设等新一代数据中心技术。

这意味着他们要建的不是传统意义上的机房，而是专为AI训练和推理优化的下一代智算中心。

这种从底层架构做起的投入，短期看很重，长期看却能形成别人难以复制的成本优势和效率优势。

融资传闻之外，DeepSeek招聘动作释放出的信号更值得关注。

IDC设计规划工程师、数据中心运维、交付管理等岗位，指向的不是一间普通互联网公司办公室，而是从园区、机房、电力、制冷到基础设施架构的完整算力工程。

岗位描述中出现「从MW到GW级基础设施规划与建设」，这句话几乎把DeepSeek下一步的战略写在了明面上。

但DeepSeek的算力布局并非蛮力堆砌，它选择了一条极具策略性的路径，将数据中心建在内蒙古乌兰察布。

乌兰察布被业内称为「草原云谷」，年均气温仅4.3℃，全年约10个月可利用自然冷源冷却，制冷成本可节约20%至30%。

当地工业电价仅为京津冀地区的一半左右，新能源装机占比超过65%，网络时延低至3.5毫秒，构成了一个难以复制的成本洼地。

资金流向人才、芯片、机房、电力、网络和运维系统，本质是把不确定的外部供给，转化为可以自己调度、自己优化、自己定价的基础设施能力。

在V3技术报告里DeepSeek-V3是6710亿总参数、每个token激活370亿参数的MoE模型，训练使用了14.8万亿token，全流程消耗约278.8万H800 GPU小时。

透过数据看内核，DeepSeek计划把模型架构、训练框架、通信策略和硬件条件放在一起做系统优化。

这对国产算力极其重要，国产AI芯片真正需要的是DeepSeek这类高强度真实工作负载。

大模型训练和推理会毫不留情地暴露问题：哪里带宽不足，哪里通信延迟高，哪里算子适配差，哪里内存管理效率低，哪里框架迁移成本高。

只有在真实业务里反复打磨，国产芯片、编译器、驱动、通信库、调度系统才会进入正循环。

因此，DeepSeek若把新资金投入国产算力基建，会成为国产AI基础设施的一座压力测试场。

过去国产算力常常被视为「备选方案」，这个转向一旦跑通，国产AI产业链获得的将不是一次采购订单，而是一套可复制的工程模板。

算法效率打底，省钱哲学成护城河

很多人提到DeepSeek的成本优势，会简单归结为「会省钱」，但这其实低估了这家公司的技术底色。

早在DeepSeek V3发布时，行业就注意到一个惊人的数字：这款性能对标GPT-4的模型，训练成本仅约600万美元，不到GPT-4训练成本的十分之一。

从自研的MoE路由策略到MLA注意力机制，再到训练框架层面的深度调优，DeepSeek团队一直在做一件事：让每一张GPU的算力都发挥到极致。

过去十年间，算法效率的提升速度实际上快于硬件摩尔定律的进展，大约每9个月就能让达到同等智能水平所需的算力减半，DeepSeek正是把这种算法效率的红利吃到了极致。

五百亿算力基建的投入，相当于给这套高效的算法系统配上了专属的硬件底座。算法优化和基建能力形成双重叠加，会产生1+1大于2的效果。

同样投入一块钱买算力，DeepSeek能产出比同行更多的模型能力，这种差距会随着规模扩大而越拉越大。

反观全球范围内的其他头部AI公司，走的大多是堆硬件的粗放路线。

OpenAI每年在算力上的投入超过百亿美元，Anthropic为了获取足够算力也在不断融资扩表。

这种模式在算力充足时跑得很快，但一旦遇到供应链波动或者成本上涨，就会面临很大的经营压力。

DeepSeek走的算法提效+自建基建路线，反而可能在长跑中显示出更强的韧性。

美国卡芯片，中国补地基

全球AI竞赛的核心约束正在从模型论文，转向芯片供应与算力管制。

美国对先进计算芯片和超级计算用途的出口管制持续加码，H800、H20等面向中国市场的产品也先后受到限制。

这类限制给中国AI公司带来的影响十分直接，算力来源不稳定，采购周期不可控，供应价格容易波动，长期路线不能完全押注外部芯片。

大模型训练可以靠阶段性集中投入完成，推理服务却需要长期稳定供给。

对于DeepSeek这种开放模型影响力迅速扩大的公司，算力供应的每一次波动，都会影响产品体验、生态信心和商业化节奏。

因此，国产AI的地基争夺战，表面是数据中心建设，深层是供应链韧性建设。

中国过去几年已经在国家层面推动算力基础设施高质量发展，「东数西算」、全国一体化算力网、八大国家算力枢纽、智能算力规模扩张，都在为AI时代铺底座。

地方智算中心可以建得很快，模型公司能不能用得顺才是下一道门槛。

结尾：

因为AI竞争越往后，越像一场大型工业系统竞赛。模型能力只是水面上的浪花，水下还有芯片、能源、网络、软件、运维、资本、政策和应用生态。

DeepSeek把战线向下推进了一层，中国AI产业也必须向下扎根一层。

部分资料参考：量子位：《国产大模型厂商DeepSeek：上线IDC岗位，500亿融资超6成投向算力基建》，中关村在线：《DeepSeek获500亿元融资，加速建设GW级算力中心支撑万亿参数大模型》，东方财富网：《新信号！DeepSeek招人将建设GW级数据中心？》，观察者网：《Deepseek为什么在乌兰察布招人？》

反馈举报

声明：以上信息仅代表发布者自身观点，并不代表本平台赞同其观点，也不代表本平台对其真实性负责。

网友评论仅供其表达个人看法，并不表明平台立场。

全部评论

加载更多

加载失败

冬天的蝉

总发布：463粉丝：0

热点丨500亿砸向算力基建，DeepSeek打响国产AI的地基争夺战

相关推荐