懂能帝首页 懂能帝首页
|
首页能源头条推荐资讯详情

黄仁勋预言成真:芯片禁令三年后,中国AI杀出四条路

2026-04-30 17:58
发布者:新经济资讯
来源:新经济资讯
标签:AI芯片
2
0
7
分享

排版|小西

黄仁勋的话应验了。

2026年4月24日,DeepSeek V4正式发布,参数规模达1.6万亿,支持100万token超长上下文。

比技术突破更引人注目的是,DeepSeek V4首次与华为昇腾芯片完成深度适配。这意味着,至少在推理端,中国最顶尖的大模型,正在摆脱对英伟达芯片的依赖。

消息传出当天,港股芯片板块集体拉升,英伟达股价则应声下跌。

除了DeepSeek,中国还有智谱、MiniMax、月之暗面等几家AI企业一同涌现。

而在三年前的2023年,中国AI产业还完全是另外一幅景象。

彼时,美国开始对中国实施英伟达H800、A800等高端AI芯片禁售,所有人都在焦虑、都在追问,中国能不能做出自己的大模型?

但是黄仁勋看得明白,后来他在多个场合表达过一个观点:“中国将借此机会培养本土企业家,自己研制芯片。”

他说的,可能正是上述还在萌芽的四颗种子。

这场大逆袭中,2025年春节DeepSeek逆袭是个不可,中国AI就开始发生改变。梁文锋入选《时代》“全球最具影响力100人”和《自然》“年度十大科学人物”。硅谷开始认真研究DeepSeek的技术报告,讨论“V3/R1时刻”对行业的冲击。

| 逆流而生 |

2023年初,杨植麟正在卡内基梅隆大学从事研究工作。作为Transformer-XL和XLNet论文的第一作者,他对大模型技术有深刻的理解。ChatGPT的出现,让他意识到一个技术范式转变的窗口可能正在打开。

就在同一时期,梁文锋在杭州管理着幻方量化。这家他一手创建的量化私募刚刚突破了百亿管理规模。作为幻方的创始人,他在那时开始思考:幻方积累的技术能力和算力资源,是否可以在AI领域做些更大的探索?

在北京,闫俊杰正在推进MiniMax的技术研发。他的公司已经成立一年半,技术方向仍在探索中,面临路线选择的考验。

而清华大学的唐杰教授正在审阅GLM-4的测试报告。作为“悟道”大模型的负责人,他比任何人都清楚中国在基础模型上的位置,尽管慢人一步,但可以追赶。

2023年,这四个人的命运,在ChatGPT引发的海啸中悄然交汇。

2022年11月30日,OpenAI创始人Sam Altman只在推特上发了一条简短的公告:“我们正式推出ChatGPT了!”

图注:OpenAI创始人Sam Altman

这甚至算不上一次合格的产品发布。但仅仅5天后,ChatGPT的用户数就突破100万;两个月后,月活用户突破1亿。

英伟达CEO黄仁勋将这一刻比作“iPhone时刻”。

ChatGPT的成功并非偶然。它建立在OpenAI多年技术积累的基础上。从GPT-1到GPT-3.5,从InstructGPT到RLHF(基于人类反馈的强化学习),每一步都在为这一刻铺垫。但真正让全世界惊喜的是,它能写代码、写诗、写论文,能理解上下文,能“涌现”出意料之外的能力。

2023年3月14日,OpenAI发布GPT-4。这一次,没有“研究预览”的谦辞,没有小心翼翼的措辞。而一份长达98页的技术报告,和一个傲人的事实:GPT-4在模拟律师考试中进入了前10%,在SAT、GRE等标准化考试中接近人类顶尖水平。

微软随即宣布将GPT-4接入Office全家桶。Windows 11开始内置AI助手。比尔·盖茨说:“这是我一生中见过的最具颠覆性的技术演示。”

而在北京,一场发布会正在酝酿。

2023年3月16日,百度创始人李彦宏站在台上,发布“文心一言”。语气里带着一丝紧张,“大家的期望值,是我们对标ChatGPT、对标GPT-4,这个门槛有点高。”

发布会采用了预录制演示而非实时问答。弹幕里有人说:“这像极了毕业答辩的自己。”发布会期间,百度港股收盘下跌6.36%,盘中最大跌幅约10%,市值蒸发数百亿。

但真正让市场担忧的不是技术差距,而是时间窗口。

如果说技术差距还可以用时间和投入来弥补,那么芯片限制则是一道更冰冷的枷锁。2022年10月,美国商务部发布针对中国的芯片出口管制规则,禁止向中国出口先进AI芯片。A100、H100等高端GPU成为禁运品。2023年10月17日,管制进一步升级,覆盖了性能稍低的芯片型号。

这意味着中国AI公司无法获得训练大模型最核心的算力资源。

阿里巴巴、字节跳动、腾讯等互联网公司选择了最稳妥的路,提前囤货,尽可能多地锁定芯片资源。

梁文锋后来在一次罕见采访中回忆那段日子:“我们很早就意识到算力会成为问题。所以幻方的策略是,在管制之前储备大量芯片。”幻方量化的萤火二号算力集群配备了1万张A100。但对于那些没有提前布局的公司来说,芯片短缺成了悬在头顶的达摩克利斯之剑。

2023年的中国互联网弥漫着一种奇特的情绪,既兴奋又焦虑。

焦虑催生了狂热。投资人开始疯狂寻找“中国版OpenAI”,任何带有“大模型”“AGI”“AI”标签的项目都能拿到融资。2023年,中国AI领域融资额创下历史新高,超过2000亿元人民币。

而在这场浪潮的中心,四位创始人做出了各自的决断,但都没有回避技术探索。

| 践行技术信仰 |

2023年初,杨植麟正在思考人生中最重要的一个决定。在一次内部讨论中,他表达了这样的判断:“如果这真的是AGI的起点,那真正的窗口期可能只有一个月。”

对于一个需要数年研发周期的大模型项目来说,一个月能做什么?

杨植麟看到的不是技术本身,而是一种结构性的机会。他做出了一个让所有人震惊的决定,放弃循环智能的一半股份,ALL IN AGI。2023年3月,月之暗面(Moonshot AI)正式成立。

为什么叫“月之暗面”?这来自Pink Floyd的专辑《The Dark Side of the Moon》。杨植麟在清华读书时曾组建Splay乐队,担任鼓手和词曲作者,音乐一直是他激情的一部分。但更深层的含义是:当所有人都在追逐光明(OpenAI)时,他选择探索那些被忽视的角落。

杨植麟选择了“长文本”作为突破口。当时GPT-4的上下文窗口只有8K tokens(约6000字),而他认为长上下文是一个被低估的方向。2023年10月,月之暗面发布Kimi Chat,支持20万汉字的超长上下文。

投资人问他:“为什么是这个方向?”他回答:“因为所有人都觉得不可能。”

同年7月,DeepSeek悄然成立。这家新公司的注册时间比月之暗面晚了三个月,但背后的资金和技术储备却远超大多数竞争对手。

梁文锋的策略是用幻方量化产生的收益,支持DeepSeek的研发运营。但真正的创新不在商业模式,而在技术路线。

当行业都在追求更大参数、更多算力时,梁文锋提出了一个反直觉的问题:“为什么训练GPT-4需要1亿美元?为什么我们不能把成本降低到十分之一?”

他要求团队:不拼算力,拼算法效率。用更少的芯片、更低的成本,做出更强的模型。

2023年年中,MiniMax也经历了一次关键的技术路线选择。公司成立已经一年半,技术方向却始终没有找到北。是继续做Transformer的Scaling(规模化)?还是探索新的架构?每个选择都可能导向完全不同的未来。

闫俊杰的创业念头,始于一个朴素的愿望。2021年春节,他回到河南商丘老家。外公已经八十多岁了,一直想写一本回忆录,记录自己的人生故事,却苦于不会打字。“要是有个机器能帮我写就好了,”外公说。

这个朴素的愿望成为闫俊杰ALL IN AI的起点。但现在,他需要做出更关键的决定。在一次管理层会议上,他宣布:“我们把80%的算力押在MoE架构上。”

MoE(Mixture of Experts,混合专家系统)在当时并不是主流路线。GPT-4用的是Dense Transformer,Google的Switch Transformer虽然验证了MoE的可行性,但效果并不稳定。

一位投资人后来回忆闫俊杰当时的决策时说:“把80%的算力押在一个非主流路线上,这几乎等于赌博。”

后来的事情证明了这次押注的正确性。但在那之前,闫俊杰经历了三四次几乎让公司崩溃的失败。

2023年10月,智谱AI完成了一笔超过25亿元的融资。投资方名单星光熠熠:阿里、腾讯、美团、蚂蚁……几乎涵盖了中国最有影响力的互联网公司。

这是唐杰第一次公开走到聚光灯下。

作为清华大学计算机系的教授、IEEE/ACM/AAAI三大学术会士,他此前一直保持低调。智谱AI的前身是清华大学知识工程实验室(KEG),他在这里工作了多年,研究知识图谱和社会网络分析。

但ChatGPT改变了一切。“技术顶天,市场立地”,唐杰一直记在心里。KEG多年的积累,包括科研人员的知识图谱、AMiner科技情报平台,以及自研的GLM预训练架构。这些成果如果只停留在论文里,那永远只是论文。

2023年,他决定迈出可能是最稳妥的一步:把清华多年的积累产业化,借助资本的力量加速追赶。他赌的是,中国独特的语料和场景优势,可以弥合与OpenAI的技术差距。

四个人的四种选择,都关系着中国AI产业的命运。

| 正面竞争 |

2023年,中国GDP增速放缓至5%左右,互联网行业裁员潮此起彼伏。AI大模型赛道成为少数几个“确定性”增长的故事。而在这个故事里,中美科技竞争是不能忽视的不确定因素。

梁文锋曾在一次非正式场合说过一句话,被广泛传播:“我们不需要复制OpenAI,我们需要证明,在资源受限的情况下,算法创新同样可以改变游戏规则。”

这句话既是对技术路线的注解,也是对时代命题的回答。

现在,DeepSeek V4用极致的技术创新,给出了答案。美国硅谷的开发者们也在调用Kimi、MiniMax、智谱的大模型,中国算力也实现了出海。

当我们回望2023年,看到的不应该只是四位创始人的成功和身价,而是在那个人人焦虑、人人期待的时代,有四个人选择了相信。

梁文锋、杨植麟、闫俊杰、唐杰他们不再像上一代企业家那样“模仿+微创新”,而是在原创性技术上与世界最强者正面竞争。他们相信技术可以改变世界。他们也相信那些看似疯狂的赌注,最终会得到时间的奖赏。

英伟达CEO黄仁勋在播客中说过一句话,被全球媒体反复引用:“如果中国的AI模型跑在华为芯片上,这对美国是‘可怕’的结果。”

这句话已经应验,但我们也要看到Anthropic正悄然崛起。其产品Claude正在证明一条可落地的商业化技术路径。2026年,Anthropic的估值将达到3800亿美元,成为OpenAI最有力的竞争者,也是我们新的对手。

答案,从来不只是终点,是下一个故事的起点。AGI的觉醒年,从来不只是某一项技术的突破,而是无数人选择相信的那一刻。

图片源于网络,侵删。

声明:以上信息仅代表发布者自身观点,并不代表本平台赞同其观点,也不代表本平台对其真实性负责。

大家都在看

广告
评论 0
网友评论仅供其表达个人看法,并不表明平台立场。
全部评论
懂能帝AI助手
服务商入驻
服务商入驻
资讯投稿
资讯发布
视频发布
视频发布
在线客服
平台客服