首页能源头条推荐资讯详情
热点丨500亿砸向算力基建,DeepSeek打响国产AI的地基争夺战
发布者:
来源:
从租算力到建算力,投入背后的成本账
2026年6月DeepSeek首轮融资细节曝光:拟募资约500亿元人民币,投后估值高达3500亿至4000亿元,这是中国AI领域有史以来最大规模的单轮融资之一。
据行业投资人预测,这笔资金中高达60%至70%,也就是300亿到350亿元,将直接流向算力基础设施建设。
在此之前,DeepSeek的算力供给主要依赖第三方云服务商,这种模式在模型研发初期足够灵活,但随着训练规模扩大和推理请求激增,短板正在快速显现。
按照业内测算,一个万卡级AI集群一年的租赁成本就在数十亿元量级。
而DeepSeek规划中的GW级算力中心,对应约50万张加速卡的规模,若全部采用租赁模式,每年的算力支出将是天文数字。
自建数据中心虽然前期投入巨大,但从三到五年的周期看,单位算力成本会显著低于租赁模式。
更深层的考量来自供应链安全,对于志在前沿模型研发的DeepSeek来说,算力供给的稳定性直接决定了产品迭代的速度。
自建算力中心相当于把发展的主动权握在自己手里,不用再看上游供应链的脸色。
从招聘信息透露的细节看,DeepSeek的基建团队已经在研究液冷、高密度供配电、模块化建设等新一代数据中心技术。
这意味着他们要建的不是传统意义上的机房,而是专为AI训练和推理优化的下一代智算中心。
这种从底层架构做起的投入,短期看很重,长期看却能形成别人难以复制的成本优势和效率优势。
融资传闻之外,DeepSeek招聘动作释放出的信号更值得关注。
IDC设计规划工程师、数据中心运维、交付管理等岗位,指向的不是一间普通互联网公司办公室,而是从园区、机房、电力、制冷到基础设施架构的完整算力工程。
岗位描述中出现「从MW到GW级基础设施规划与建设」,这句话几乎把DeepSeek下一步的战略写在了明面上。
但DeepSeek的算力布局并非蛮力堆砌,它选择了一条极具策略性的路径,将数据中心建在内蒙古乌兰察布。
乌兰察布被业内称为「草原云谷」,年均气温仅4.3℃,全年约10个月可利用自然冷源冷却,制冷成本可节约20%至30%。
当地工业电价仅为京津冀地区的一半左右,新能源装机占比超过65%,网络时延低至3.5毫秒,构成了一个难以复制的成本洼地。
资金流向人才、芯片、机房、电力、网络和运维系统,本质是把不确定的外部供给,转化为可以自己调度、自己优化、自己定价的基础设施能力。
在V3技术报告里DeepSeek-V3是6710亿总参数、每个token激活370亿参数的MoE模型,训练使用了14.8万亿token,全流程消耗约278.8万H800 GPU小时。
透过数据看内核,DeepSeek计划把模型架构、训练框架、通信策略和硬件条件放在一起做系统优化。
这对国产算力极其重要,国产AI芯片真正需要的是DeepSeek这类高强度真实工作负载。
大模型训练和推理会毫不留情地暴露问题:哪里带宽不足,哪里通信延迟高,哪里算子适配差,哪里内存管理效率低,哪里框架迁移成本高。
只有在真实业务里反复打磨,国产芯片、编译器、驱动、通信库、调度系统才会进入正循环。
因此,DeepSeek若把新资金投入国产算力基建,会成为国产AI基础设施的一座压力测试场。
过去国产算力常常被视为「备选方案」,这个转向一旦跑通,国产AI产业链获得的将不是一次采购订单,而是一套可复制的工程模板。
算法效率打底,省钱哲学成护城河
很多人提到DeepSeek的成本优势,会简单归结为「会省钱」,但这其实低估了这家公司的技术底色。
早在DeepSeek V3发布时,行业就注意到一个惊人的数字:这款性能对标GPT-4的模型,训练成本仅约600万美元,不到GPT-4训练成本的十分之一。
从自研的MoE路由策略到MLA注意力机制,再到训练框架层面的深度调优,DeepSeek团队一直在做一件事:让每一张GPU的算力都发挥到极致。
过去十年间,算法效率的提升速度实际上快于硬件摩尔定律的进展,大约每9个月就能让达到同等智能水平所需的算力减半,DeepSeek正是把这种算法效率的红利吃到了极致。
五百亿算力基建的投入,相当于给这套高效的算法系统配上了专属的硬件底座。算法优化和基建能力形成双重叠加,会产生1+1大于2的效果。
同样投入一块钱买算力,DeepSeek能产出比同行更多的模型能力,这种差距会随着规模扩大而越拉越大。
反观全球范围内的其他头部AI公司,走的大多是堆硬件的粗放路线。
OpenAI每年在算力上的投入超过百亿美元,Anthropic为了获取足够算力也在不断融资扩表。
这种模式在算力充足时跑得很快,但一旦遇到供应链波动或者成本上涨,就会面临很大的经营压力。
DeepSeek走的算法提效+自建基建路线,反而可能在长跑中显示出更强的韧性。
美国卡芯片,中国补地基
全球AI竞赛的核心约束正在从模型论文,转向芯片供应与算力管制。
美国对先进计算芯片和超级计算用途的出口管制持续加码,H800、H20等面向中国市场的产品也先后受到限制。
这类限制给中国AI公司带来的影响十分直接,算力来源不稳定,采购周期不可控,供应价格容易波动,长期路线不能完全押注外部芯片。
大模型训练可以靠阶段性集中投入完成,推理服务却需要长期稳定供给。
对于DeepSeek这种开放模型影响力迅速扩大的公司,算力供应的每一次波动,都会影响产品体验、生态信心和商业化节奏。
因此,国产AI的地基争夺战,表面是数据中心建设,深层是供应链韧性建设。
中国过去几年已经在国家层面推动算力基础设施高质量发展,「东数西算」、全国一体化算力网、八大国家算力枢纽、智能算力规模扩张,都在为AI时代铺底座。
地方智算中心可以建得很快,模型公司能不能用得顺才是下一道门槛。
结尾:
因为AI竞争越往后,越像一场大型工业系统竞赛。模型能力只是水面上的浪花,水下还有芯片、能源、网络、软件、运维、资本、政策和应用生态。
DeepSeek把战线向下推进了一层,中国AI产业也必须向下扎根一层。
部分资料参考:量子位:《国产大模型厂商DeepSeek:上线IDC岗位,500亿融资超6成投向算力基建》,中关村在线:《DeepSeek获500亿元融资,加速建设GW级算力中心支撑万亿参数大模型》,东方财富网:《新信号!DeepSeek招人 将建设GW级数据中心?》,观察者网:《Deepseek为什么在乌兰察布招人?》
反馈举报
声明:以上信息仅代表发布者自身观点,并不代表本平台赞同其观点,也不代表本平台对其真实性负责。
评论 0
网友评论仅供其表达个人看法,并不表明平台立场。全部评论
加载失败
总发布:463粉丝:0
相关推荐
- 加载失败
- 加载失败
- 加载失败
冬天的蝉
- 加载失败
- 加载失败
- 加载失败
- 加载失败
- 加载失败
- 加载失败
- 加载失败







