懂能帝首页 懂能帝首页
|
首页能源头条推荐资讯详情

憋了十五个月之后,梁文锋直接掀了牌桌

2026-04-30 17:59
发布者:新经济资讯
来源:新经济资讯
标签:
1
0
7
分享

2026年4月24日,OpenAI刚扔出GPT-5.5,试图把大模型定价权往上拉一截。几个小时后,梁文锋做了一个让硅谷措手不及的动作。

DeepSeek V4预览版上线了。没有发布会,没有演讲稿,就一组数字:百万token输入,缓存命中后1块钱。Flash版更狠,两毛钱。梁文锋似乎在用DeepSeek V4告诉硅谷:你想涨价随便涨,我接着往下打。

而V4发布前不到48小时,融资传闻也炸了出来:阿里巴巴和腾讯同时盯上了DeepSeek,估值从传言中的100亿美元一路被拉到超过200亿美元。两家巨头预计合计投资18亿美元,不到一周时间估值翻倍,资本市场从来不相信什么情怀,肯给这个价,说明有人嗅到了新信号。

这十五个月,DeepSeek沉默了太久。2025年1月R1横空出世的时候,英伟达一天市值蒸发了近6000亿美元,全球AI圈都在喊DeepSeek时刻。之后呢?整整一年多没有大版本更新,发布窗口一延再延,从年初推到春天,从2月推到快4月底。外界开始嘀咕:是不是瓶颈了?是不是算力被卡死了?是不是那个靠幻方量化输血做开源的天才终于烧不动了?

但今年4月22日,一切变了。憋了十五个月之后,梁文锋直接掀了牌桌。一边用开源模型把成本打到脚踝,一边用资本市场的翻倍估值告诉所有人:那个躲在幻方量化的利润背后、不接投资人电话的理想主义者,没了。

取而代之的,是一个更凶猛的DeepSeek。

01

把模型成本打下来,比什么都硬核

看V4的技术参数,不要被1.6万亿总参数唬住,真正要命的是它的成本账。

总参数涨到1.6万亿,激活参数490亿,MoE架构下每层384个专家。这些数字不重要。重要的是:上下文从128K直接顶到100万,将近八倍的容量扩张,但每个token的算力消耗反而降下来了。KV缓存占用砍到原来的十分之一。

怎么做到的?不是堆算力,是换算法。用CSA和HCA混合注意力机制,把全量计算改成稀疏计算,把均匀扫读换成分层精读。说人话就是:以前模型看一篇百万字的小说要逐字逐句看,现在它会跳着看重点,该细的地方细,该略的地方略。

这带来的结果,是价格彻底打穿地板。

DeepSeek V4-Pro缓存命中后输入价格1元/百万token,Flash版0.2元,输出端最贵也才2元。而一天前发布的GPT-5.5输出价格是30美元/百万token,差了近100倍。不仅是OpenAI,Gemini 3.1 Pro定价12美元,Claude Opus 4.7高达25美元。V4-Pro的3.48美元直接把大模型前沿区间的价格锚点砸到地板以下。

这不是营销噱头,是工程逻辑层面的降维打击。当开发者发现用V4调一次百万上下文的花费还买不了一瓶矿泉水,谁还会去为闭源模型付几十美元?全球开发者用脚投票,答案不用猜。

在《云涌商业》看来,DeepSeek是AI界的拼多多。这个比喻糙,但不离谱。拼多多做的是把下沉市场的价格打穿,DeepSeek做的是把AI调用的成本打穿。拼多多靠的是对供应链的极致压榨,DeepSeek靠的是对算法和架构的极致重构。

路子不同,意思是一样的,用别人看不懂的模型结构,把成本结构重写一遍,然后拿出一张所有人都无法拒绝的价签。

但DeepSeek和拼多多有一个本质区别。拼多多赚钱,DeepSeek不想靠API赚钱。V4全部开源,采用MIT协议,允许免费商用。这哪里是拼多多的生意逻辑,这分明是互联网早期水电煤的气质,把基础设施搭好,把价格降到零,让所有人在上面盖房子。

DeepSeek自己的话比任何分析都更直白:预计下半年昇腾950超节点批量上市后,Pro版价格还将大幅下调。不是说现在的价格已经够低就不再降了,是越用越便宜,越跑越往下打。这条成本曲线的终点不是盈亏平衡,是零。

DeepSeek自己也很清醒。官方承认V4整体水平还落后GPT-5.4和Gemini-Pro-3.1大约三到六个月。但这种坦诚不是示弱,是在说:跑分游戏你们玩,我先把成本账算清楚。Agent爆发的前夜,谁能把百万上下文做成标配,谁就拿到了AI工业化最值钱的那张船票。

02

梁文锋终于接起了投资人的电话

梁文锋不融资的故事,之前被讲成了一种技术洁癖。

2025年初R1火了之后,投资圈的电话他一个没接。腾讯、阿里面试的机会,他一个没给。理由很简单:资本会干扰技术判断。他能这么硬气,靠的是幻方量化那个金库。从量化交易的上千亿规模里切出一块持续输送给AI研究,持股超过84%,在AI创业圈几乎是独一份的存在。

但到了2026年,这条路堵死了。不是幻方赚得不够多,是AI竞赛的成本增速远远超过了量化收益的增速。OpenAI、Anthropic单轮融资动辄上千亿人民币,人才的全球定价权被巨头捏得死死的。

最让梁文锋难受的还不是钱,是核心团队被一个个挖走。

据公开资料,2025年下半年至今,DeepSeek至少有5名核心研发成员确认离职。第一代大语言模型核心作者王炳宣去了腾讯;V3核心贡献者罗福莉被雷军挖至小米,出任MiMo团队负责人;R1核心研究员郭达雅被字节大模型团队直接挖走;OCR系列核心作者魏浩然和多模态成果核心贡献者阮翀也先后离开。这些人覆盖了基座模型、推理、OCR和多模态四条核心技术主线。

DeepSeek总共不到200人,核心研究团队100多人,基模架构团队仅小几十人。在极度依赖个人能力的小团队里,每一个核心研究员的流失都意味着整条技术线的停顿,情怀喂不饱人。

V4从原定的2月发布窗口一拖再拖,核心原因就是算力成本从百万美元级跳到了十亿美元级。幻方再能挣钱,也撑不起这种烧法。融资,从可选项变成了必选项。

融资消息出来后,最炸裂的不是金额本身,虽然也不小,而是估值的拉升速度。从100亿美元翻到200亿美元以上,几天之内翻倍。这个估值放到同行里看,智谱当前市值超500亿美元,MiniMax超300亿美元,但这两家已经商业化运营,拥有B端客户和稳定收入流。DeepSeek迄今未产生收入,200亿美元的估值已经是一个非商业化公司能够触及的天花板,

资本市场突然意识到,DeepSeek不再是那个需要被怜悯的小众技术玩家,它是一个确定性的交易标的。

张爱玲说成名要趁早。但梁文锋用这一年半证明了另一件事:在AI这场战争里,活到终局比趁早成名重要得多。不缺钱不代表不需要钱,不需要钱不代表不需要一个市值锚定。接起投资人的电话,不是理想主义的溃败,是梁文锋第一次承认,在金钱游戏里,最傻的事就是假装自己不用出牌。

03

华为昇腾,才是DeepSeek的隐藏底牌

V4的公告里藏着一个几乎被忽略的细节:DeepSeek第一次把华为昇腾写进了官方硬件适配名单。

为了做这个切换,团队把整套原本跑在英伟达CUDA上的系统全部重写,迁移到华为CANN国产框架上。这不是一个轻松的决定。英伟达GPU在高端训练场景的优势仍然是碾压级的,华为芯片在算力、工具链、生态上都有明显的差距。

但梁文锋赌的不是眼下这一点算力差距,他赌的是格局。一旦中国有了完全自主可控的AI算力底座,美国的芯片管制、贸易制裁就再也掐不住脖子。一周前黄仁勋说了一句话,翻译过来就是:如果DeepSeek率先在华为平台上实现了深度优化,对美国的AI产业来说,那将是一个可怕的结局。

华为昇腾950芯片的量产已经在路上,预计下半年上线。DeepSeek之所以敢把V4的价格压到这么低,不光是算法优化的功劳,更是因为底层的芯片成本已经在换。V4降了一半价,不是因为心善,是因为换了供应商。

西方媒体注意到了这层含义。彭博说V4是对OpenAI和Anthropic的有力挑战,CNBC说这是一次全方位的实力展示。路透社的切口更准——这不是单纯的模型迭代,是中国AI去英伟达化的关键一步。在代码层面撬动整个AI国产化链条,比发布一款模型更让对手坐立不安。

未来的AI竞争,不再是单一厂商之间的跑分竞赛,而是中国AI生态和美国AI生态之间的惨烈绞杀。DeepSeek用开源释放能量,华为用芯片提供底座。这个组合拿到牌桌上,已经不是卡牌玩家,是规则改写者。

没有人比梁文锋更清楚AGI有多远。他也比任何人更清楚,活不到终局的理想主义一文不值。

过去十五个月,DeepSeek经历了核心高管被挖角,发布窗口一拖再拖,外部舆论从神化到质疑的过山车。2025年夏天,全球下载量从峰值的8000万一路下滑到2000万,月活被字节豆包反超。所有信号都在说同一件事:没有资本托底的技术理想,撑不过行业冬天。

V4和融资同步落地,像梁文锋在棋盘上同时落下的两枚棋子。一个证明他做什么的判断没有变,另一个证明他怎么做的判断已经彻底变了。融资不是理想主义的终结,是理想主义接入了一个更庞大的机器。估值200亿美元不仅仅是钱的数目,更是市场对DeepSeek能否活到终局投下的信任票。

梁文锋在用别人看不懂的节奏,下一盘更大的棋。这盘棋的名字不叫R1,不叫V4,不叫昇腾,甚至不叫200亿美元,它叫生存。先活下来,才有资格谈颠覆。

声明:以上信息仅代表发布者自身观点,并不代表本平台赞同其观点,也不代表本平台对其真实性负责。

大家都在看

广告
评论 0
网友评论仅供其表达个人看法,并不表明平台立场。
全部评论
懂能帝AI助手
服务商入驻
服务商入驻
资讯投稿
资讯发布
视频发布
视频发布
在线客服
平台客服