首页能源头条推荐资讯详情

憋了十五个月之后，梁文锋直接掀了牌桌

2026-04-30 17:59

发布者：新经济资讯

来源：新经济资讯

标签：

2026年4月24日，OpenAI刚扔出GPT-5.5，试图把大模型定价权往上拉一截。几个小时后，梁文锋做了一个让硅谷措手不及的动作。

DeepSeek V4预览版上线了。没有发布会，没有演讲稿，就一组数字：百万token输入，缓存命中后1块钱。Flash版更狠，两毛钱。梁文锋似乎在用DeepSeek V4告诉硅谷：你想涨价随便涨，我接着往下打。

而V4发布前不到48小时，融资传闻也炸了出来：阿里巴巴和腾讯同时盯上了DeepSeek，估值从传言中的100亿美元一路被拉到超过200亿美元。两家巨头预计合计投资18亿美元，不到一周时间估值翻倍，资本市场从来不相信什么情怀，肯给这个价，说明有人嗅到了新信号。

这十五个月，DeepSeek沉默了太久。2025年1月R1横空出世的时候，英伟达一天市值蒸发了近6000亿美元，全球AI圈都在喊DeepSeek时刻。之后呢？整整一年多没有大版本更新，发布窗口一延再延，从年初推到春天，从2月推到快4月底。外界开始嘀咕：是不是瓶颈了？是不是算力被卡死了？是不是那个靠幻方量化输血做开源的天才终于烧不动了？

但今年4月22日，一切变了。憋了十五个月之后，梁文锋直接掀了牌桌。一边用开源模型把成本打到脚踝，一边用资本市场的翻倍估值告诉所有人：那个躲在幻方量化的利润背后、不接投资人电话的理想主义者，没了。

取而代之的，是一个更凶猛的DeepSeek。

把模型成本打下来，比什么都硬核

看V4的技术参数，不要被1.6万亿总参数唬住，真正要命的是它的成本账。

总参数涨到1.6万亿，激活参数490亿，MoE架构下每层384个专家。这些数字不重要。重要的是：上下文从128K直接顶到100万，将近八倍的容量扩张，但每个token的算力消耗反而降下来了。KV缓存占用砍到原来的十分之一。

怎么做到的？不是堆算力，是换算法。用CSA和HCA混合注意力机制，把全量计算改成稀疏计算，把均匀扫读换成分层精读。说人话就是：以前模型看一篇百万字的小说要逐字逐句看，现在它会跳着看重点，该细的地方细，该略的地方略。

这带来的结果，是价格彻底打穿地板。

DeepSeek V4-Pro缓存命中后输入价格1元/百万token，Flash版0.2元，输出端最贵也才2元。而一天前发布的GPT-5.5输出价格是30美元/百万token，差了近100倍。不仅是OpenAI，Gemini 3.1 Pro定价12美元，Claude Opus 4.7高达25美元。V4-Pro的3.48美元直接把大模型前沿区间的价格锚点砸到地板以下。

这不是营销噱头，是工程逻辑层面的降维打击。当开发者发现用V4调一次百万上下文的花费还买不了一瓶矿泉水，谁还会去为闭源模型付几十美元？全球开发者用脚投票，答案不用猜。

在《云涌商业》看来，DeepSeek是AI界的拼多多。这个比喻糙，但不离谱。拼多多做的是把下沉市场的价格打穿，DeepSeek做的是把AI调用的成本打穿。拼多多靠的是对供应链的极致压榨，DeepSeek靠的是对算法和架构的极致重构。

路子不同，意思是一样的，用别人看不懂的模型结构，把成本结构重写一遍，然后拿出一张所有人都无法拒绝的价签。

但DeepSeek和拼多多有一个本质区别。拼多多赚钱，DeepSeek不想靠API赚钱。V4全部开源，采用MIT协议，允许免费商用。这哪里是拼多多的生意逻辑，这分明是互联网早期水电煤的气质，把基础设施搭好，把价格降到零，让所有人在上面盖房子。

DeepSeek自己的话比任何分析都更直白：预计下半年昇腾950超节点批量上市后，Pro版价格还将大幅下调。不是说现在的价格已经够低就不再降了，是越用越便宜，越跑越往下打。这条成本曲线的终点不是盈亏平衡，是零。

DeepSeek自己也很清醒。官方承认V4整体水平还落后GPT-5.4和Gemini-Pro-3.1大约三到六个月。但这种坦诚不是示弱，是在说：跑分游戏你们玩，我先把成本账算清楚。Agent爆发的前夜，谁能把百万上下文做成标配，谁就拿到了AI工业化最值钱的那张船票。

梁文锋终于接起了投资人的电话

梁文锋不融资的故事，之前被讲成了一种技术洁癖。

2025年初R1火了之后，投资圈的电话他一个没接。腾讯、阿里面试的机会，他一个没给。理由很简单：资本会干扰技术判断。他能这么硬气，靠的是幻方量化那个金库。从量化交易的上千亿规模里切出一块持续输送给AI研究，持股超过84%，在AI创业圈几乎是独一份的存在。

但到了2026年，这条路堵死了。不是幻方赚得不够多，是AI竞赛的成本增速远远超过了量化收益的增速。OpenAI、Anthropic单轮融资动辄上千亿人民币，人才的全球定价权被巨头捏得死死的。

最让梁文锋难受的还不是钱，是核心团队被一个个挖走。

据公开资料，2025年下半年至今，DeepSeek至少有5名核心研发成员确认离职。第一代大语言模型核心作者王炳宣去了腾讯；V3核心贡献者罗福莉被雷军挖至小米，出任MiMo团队负责人；R1核心研究员郭达雅被字节大模型团队直接挖走；OCR系列核心作者魏浩然和多模态成果核心贡献者阮翀也先后离开。这些人覆盖了基座模型、推理、OCR和多模态四条核心技术主线。

DeepSeek总共不到200人，核心研究团队100多人，基模架构团队仅小几十人。在极度依赖个人能力的小团队里，每一个核心研究员的流失都意味着整条技术线的停顿，情怀喂不饱人。

V4从原定的2月发布窗口一拖再拖，核心原因就是算力成本从百万美元级跳到了十亿美元级。幻方再能挣钱，也撑不起这种烧法。融资，从可选项变成了必选项。

融资消息出来后，最炸裂的不是金额本身，虽然也不小，而是估值的拉升速度。从100亿美元翻到200亿美元以上，几天之内翻倍。这个估值放到同行里看，智谱当前市值超500亿美元，MiniMax超300亿美元，但这两家已经商业化运营，拥有B端客户和稳定收入流。DeepSeek迄今未产生收入，200亿美元的估值已经是一个非商业化公司能够触及的天花板，

资本市场突然意识到，DeepSeek不再是那个需要被怜悯的小众技术玩家，它是一个确定性的交易标的。

张爱玲说成名要趁早。但梁文锋用这一年半证明了另一件事：在AI这场战争里，活到终局比趁早成名重要得多。不缺钱不代表不需要钱，不需要钱不代表不需要一个市值锚定。接起投资人的电话，不是理想主义的溃败，是梁文锋第一次承认，在金钱游戏里，最傻的事就是假装自己不用出牌。

华为昇腾，才是DeepSeek的隐藏底牌

V4的公告里藏着一个几乎被忽略的细节：DeepSeek第一次把华为昇腾写进了官方硬件适配名单。

为了做这个切换，团队把整套原本跑在英伟达CUDA上的系统全部重写，迁移到华为CANN国产框架上。这不是一个轻松的决定。英伟达GPU在高端训练场景的优势仍然是碾压级的，华为芯片在算力、工具链、生态上都有明显的差距。

但梁文锋赌的不是眼下这一点算力差距，他赌的是格局。一旦中国有了完全自主可控的AI算力底座，美国的芯片管制、贸易制裁就再也掐不住脖子。一周前黄仁勋说了一句话，翻译过来就是：如果DeepSeek率先在华为平台上实现了深度优化，对美国的AI产业来说，那将是一个可怕的结局。

华为昇腾950芯片的量产已经在路上，预计下半年上线。DeepSeek之所以敢把V4的价格压到这么低，不光是算法优化的功劳，更是因为底层的芯片成本已经在换。V4降了一半价，不是因为心善，是因为换了供应商。

西方媒体注意到了这层含义。彭博说V4是对OpenAI和Anthropic的有力挑战，CNBC说这是一次全方位的实力展示。路透社的切口更准——这不是单纯的模型迭代，是中国AI去英伟达化的关键一步。在代码层面撬动整个AI国产化链条，比发布一款模型更让对手坐立不安。

未来的AI竞争，不再是单一厂商之间的跑分竞赛，而是中国AI生态和美国AI生态之间的惨烈绞杀。DeepSeek用开源释放能量，华为用芯片提供底座。这个组合拿到牌桌上，已经不是卡牌玩家，是规则改写者。

没有人比梁文锋更清楚AGI有多远。他也比任何人更清楚，活不到终局的理想主义一文不值。

过去十五个月，DeepSeek经历了核心高管被挖角，发布窗口一拖再拖，外部舆论从神化到质疑的过山车。2025年夏天，全球下载量从峰值的8000万一路下滑到2000万，月活被字节豆包反超。所有信号都在说同一件事：没有资本托底的技术理想，撑不过行业冬天。

V4和融资同步落地，像梁文锋在棋盘上同时落下的两枚棋子。一个证明他做什么的判断没有变，另一个证明他怎么做的判断已经彻底变了。融资不是理想主义的终结，是理想主义接入了一个更庞大的机器。估值200亿美元不仅仅是钱的数目，更是市场对DeepSeek能否活到终局投下的信任票。

梁文锋在用别人看不懂的节奏，下一盘更大的棋。这盘棋的名字不叫R1，不叫V4，不叫昇腾，甚至不叫200亿美元，它叫生存。先活下来，才有资格谈颠覆。

反馈举报

声明：以上信息仅代表发布者自身观点，并不代表本平台赞同其观点，也不代表本平台对其真实性负责。

网友评论仅供其表达个人看法，并不表明平台立场。

全部评论

加载更多

加载失败

新经济资讯

总发布：516粉丝：2

憋了十五个月之后，梁文锋直接掀了牌桌

大家都在看

相关推荐