首页能源头条推荐资讯详情

黄仁勋预言成真：芯片禁令三年后，中国AI杀出四条路

2026-04-30 17:58

发布者：新经济资讯

来源：新经济资讯

标签：AI芯片

排版｜小西

黄仁勋的话应验了。

2026年4月24日，DeepSeek V4正式发布，参数规模达1.6万亿，支持100万token超长上下文。

比技术突破更引人注目的是，DeepSeek V4首次与华为昇腾芯片完成深度适配。这意味着，至少在推理端，中国最顶尖的大模型，正在摆脱对英伟达芯片的依赖。

消息传出当天，港股芯片板块集体拉升，英伟达股价则应声下跌。

除了DeepSeek，中国还有智谱、MiniMax、月之暗面等几家AI企业一同涌现。

而在三年前的2023年，中国AI产业还完全是另外一幅景象。

彼时，美国开始对中国实施英伟达H800、A800等高端AI芯片禁售，所有人都在焦虑、都在追问，中国能不能做出自己的大模型？

但是黄仁勋看得明白，后来他在多个场合表达过一个观点：“中国将借此机会培养本土企业家，自己研制芯片。”

他说的，可能正是上述还在萌芽的四颗种子。

这场大逆袭中，2025年春节DeepSeek逆袭是个不可，中国AI就开始发生改变。梁文锋入选《时代》“全球最具影响力100人”和《自然》“年度十大科学人物”。硅谷开始认真研究DeepSeek的技术报告，讨论“V3/R1时刻”对行业的冲击。

| 逆流而生 |

2023年初，杨植麟正在卡内基梅隆大学从事研究工作。作为Transformer-XL和XLNet论文的第一作者，他对大模型技术有深刻的理解。ChatGPT的出现，让他意识到一个技术范式转变的窗口可能正在打开。

就在同一时期，梁文锋在杭州管理着幻方量化。这家他一手创建的量化私募刚刚突破了百亿管理规模。作为幻方的创始人，他在那时开始思考：幻方积累的技术能力和算力资源，是否可以在AI领域做些更大的探索？

在北京，闫俊杰正在推进MiniMax的技术研发。他的公司已经成立一年半，技术方向仍在探索中，面临路线选择的考验。

而清华大学的唐杰教授正在审阅GLM-4的测试报告。作为“悟道”大模型的负责人，他比任何人都清楚中国在基础模型上的位置，尽管慢人一步，但可以追赶。

2023年，这四个人的命运，在ChatGPT引发的海啸中悄然交汇。

2022年11月30日，OpenAI创始人Sam Altman只在推特上发了一条简短的公告：“我们正式推出ChatGPT了！”

图注：OpenAI创始人Sam Altman

这甚至算不上一次合格的产品发布。但仅仅5天后，ChatGPT的用户数就突破100万；两个月后，月活用户突破1亿。

英伟达CEO黄仁勋将这一刻比作“iPhone时刻”。

ChatGPT的成功并非偶然。它建立在OpenAI多年技术积累的基础上。从GPT-1到GPT-3.5，从InstructGPT到RLHF（基于人类反馈的强化学习），每一步都在为这一刻铺垫。但真正让全世界惊喜的是，它能写代码、写诗、写论文，能理解上下文，能“涌现”出意料之外的能力。

2023年3月14日，OpenAI发布GPT-4。这一次，没有“研究预览”的谦辞，没有小心翼翼的措辞。而一份长达98页的技术报告，和一个傲人的事实：GPT-4在模拟律师考试中进入了前10%，在SAT、GRE等标准化考试中接近人类顶尖水平。

微软随即宣布将GPT-4接入Office全家桶。Windows 11开始内置AI助手。比尔·盖茨说：“这是我一生中见过的最具颠覆性的技术演示。”

而在北京，一场发布会正在酝酿。

2023年3月16日，百度创始人李彦宏站在台上，发布“文心一言”。语气里带着一丝紧张，“大家的期望值，是我们对标ChatGPT、对标GPT-4，这个门槛有点高。”

发布会采用了预录制演示而非实时问答。弹幕里有人说：“这像极了毕业答辩的自己。”发布会期间，百度港股收盘下跌6.36%，盘中最大跌幅约10%，市值蒸发数百亿。

但真正让市场担忧的不是技术差距，而是时间窗口。

如果说技术差距还可以用时间和投入来弥补，那么芯片限制则是一道更冰冷的枷锁。2022年10月，美国商务部发布针对中国的芯片出口管制规则，禁止向中国出口先进AI芯片。A100、H100等高端GPU成为禁运品。2023年10月17日，管制进一步升级，覆盖了性能稍低的芯片型号。

这意味着中国AI公司无法获得训练大模型最核心的算力资源。

阿里巴巴、字节跳动、腾讯等互联网公司选择了最稳妥的路，提前囤货，尽可能多地锁定芯片资源。

梁文锋后来在一次罕见采访中回忆那段日子：“我们很早就意识到算力会成为问题。所以幻方的策略是，在管制之前储备大量芯片。”幻方量化的萤火二号算力集群配备了1万张A100。但对于那些没有提前布局的公司来说，芯片短缺成了悬在头顶的达摩克利斯之剑。

2023年的中国互联网弥漫着一种奇特的情绪，既兴奋又焦虑。

焦虑催生了狂热。投资人开始疯狂寻找“中国版OpenAI”，任何带有“大模型”“AGI”“AI”标签的项目都能拿到融资。2023年，中国AI领域融资额创下历史新高，超过2000亿元人民币。

而在这场浪潮的中心，四位创始人做出了各自的决断，但都没有回避技术探索。

| 践行技术信仰 |

2023年初，杨植麟正在思考人生中最重要的一个决定。在一次内部讨论中，他表达了这样的判断：“如果这真的是AGI的起点，那真正的窗口期可能只有一个月。”

对于一个需要数年研发周期的大模型项目来说，一个月能做什么？

杨植麟看到的不是技术本身，而是一种结构性的机会。他做出了一个让所有人震惊的决定，放弃循环智能的一半股份，ALL IN AGI。2023年3月，月之暗面（Moonshot AI）正式成立。

为什么叫“月之暗面”？这来自Pink Floyd的专辑《The Dark Side of the Moon》。杨植麟在清华读书时曾组建Splay乐队，担任鼓手和词曲作者，音乐一直是他激情的一部分。但更深层的含义是：当所有人都在追逐光明（OpenAI）时，他选择探索那些被忽视的角落。

杨植麟选择了“长文本”作为突破口。当时GPT-4的上下文窗口只有8K tokens（约6000字），而他认为长上下文是一个被低估的方向。2023年10月，月之暗面发布Kimi Chat，支持20万汉字的超长上下文。

投资人问他：“为什么是这个方向？”他回答：“因为所有人都觉得不可能。”

同年7月，DeepSeek悄然成立。这家新公司的注册时间比月之暗面晚了三个月，但背后的资金和技术储备却远超大多数竞争对手。

梁文锋的策略是用幻方量化产生的收益，支持DeepSeek的研发运营。但真正的创新不在商业模式，而在技术路线。

当行业都在追求更大参数、更多算力时，梁文锋提出了一个反直觉的问题：“为什么训练GPT-4需要1亿美元？为什么我们不能把成本降低到十分之一？”

他要求团队：不拼算力，拼算法效率。用更少的芯片、更低的成本，做出更强的模型。

2023年年中，MiniMax也经历了一次关键的技术路线选择。公司成立已经一年半，技术方向却始终没有找到北。是继续做Transformer的Scaling（规模化）？还是探索新的架构？每个选择都可能导向完全不同的未来。

闫俊杰的创业念头，始于一个朴素的愿望。2021年春节，他回到河南商丘老家。外公已经八十多岁了，一直想写一本回忆录，记录自己的人生故事，却苦于不会打字。“要是有个机器能帮我写就好了，”外公说。

这个朴素的愿望成为闫俊杰ALL IN AI的起点。但现在，他需要做出更关键的决定。在一次管理层会议上，他宣布：“我们把80%的算力押在MoE架构上。”

MoE（Mixture of Experts，混合专家系统）在当时并不是主流路线。GPT-4用的是Dense Transformer，Google的Switch Transformer虽然验证了MoE的可行性，但效果并不稳定。

一位投资人后来回忆闫俊杰当时的决策时说：“把80%的算力押在一个非主流路线上，这几乎等于赌博。”

后来的事情证明了这次押注的正确性。但在那之前，闫俊杰经历了三四次几乎让公司崩溃的失败。

2023年10月，智谱AI完成了一笔超过25亿元的融资。投资方名单星光熠熠：阿里、腾讯、美团、蚂蚁……几乎涵盖了中国最有影响力的互联网公司。

这是唐杰第一次公开走到聚光灯下。

作为清华大学计算机系的教授、IEEE/ACM/AAAI三大学术会士，他此前一直保持低调。智谱AI的前身是清华大学知识工程实验室（KEG），他在这里工作了多年，研究知识图谱和社会网络分析。

但ChatGPT改变了一切。“技术顶天，市场立地”，唐杰一直记在心里。KEG多年的积累，包括科研人员的知识图谱、AMiner科技情报平台，以及自研的GLM预训练架构。这些成果如果只停留在论文里，那永远只是论文。

2023年，他决定迈出可能是最稳妥的一步：把清华多年的积累产业化，借助资本的力量加速追赶。他赌的是，中国独特的语料和场景优势，可以弥合与OpenAI的技术差距。

四个人的四种选择，都关系着中国AI产业的命运。

| 正面竞争 |

2023年，中国GDP增速放缓至5%左右，互联网行业裁员潮此起彼伏。AI大模型赛道成为少数几个“确定性”增长的故事。而在这个故事里，中美科技竞争是不能忽视的不确定因素。

梁文锋曾在一次非正式场合说过一句话，被广泛传播：“我们不需要复制OpenAI，我们需要证明，在资源受限的情况下，算法创新同样可以改变游戏规则。”

这句话既是对技术路线的注解，也是对时代命题的回答。

现在，DeepSeek V4用极致的技术创新，给出了答案。美国硅谷的开发者们也在调用Kimi、MiniMax、智谱的大模型，中国算力也实现了出海。

当我们回望2023年，看到的不应该只是四位创始人的成功和身价，而是在那个人人焦虑、人人期待的时代，有四个人选择了相信。

梁文锋、杨植麟、闫俊杰、唐杰他们不再像上一代企业家那样“模仿+微创新”，而是在原创性技术上与世界最强者正面竞争。他们相信技术可以改变世界。他们也相信那些看似疯狂的赌注，最终会得到时间的奖赏。

英伟达CEO黄仁勋在播客中说过一句话，被全球媒体反复引用：“如果中国的AI模型跑在华为芯片上，这对美国是‘可怕’的结果。”

这句话已经应验，但我们也要看到Anthropic正悄然崛起。其产品Claude正在证明一条可落地的商业化技术路径。2026年，Anthropic的估值将达到3800亿美元，成为OpenAI最有力的竞争者，也是我们新的对手。

答案，从来不只是终点，是下一个故事的起点。AGI的觉醒年，从来不只是某一项技术的突破，而是无数人选择相信的那一刻。

图片源于网络，侵删。

反馈举报

声明：以上信息仅代表发布者自身观点，并不代表本平台赞同其观点，也不代表本平台对其真实性负责。

网友评论仅供其表达个人看法，并不表明平台立场。

全部评论

加载更多

加载失败

新经济资讯

总发布：516粉丝：2

黄仁勋预言成真：芯片禁令三年后，中国AI杀出四条路

大家都在看

相关推荐