2026年4月15日,播客主持人Dwarkesh Patel做了一件许多主持人不敢做的事——他在采访英伟达CEO黄仁勋时,一路追问到这家全球最高市值公司的"核心命门"。当然,他自己说他是刻意站在被采访人的对立方提问题,且以Dario支持芯片出口限制的观点出发。

这场近两小时的访谈,在第57分钟时陷入僵局,我特别看了这部分内容,两人的相关争论持续了30分钟左右,这在很多超大企业CEO的采访中非常罕见。

双方的分歧主要在于英伟达高端芯片对中国市场的出口限制是否具有合理性。



我的看法:两人分歧的根源,不在于生意,而在于不同的出发点、心态和竞争逻辑。


一场关于AI终局的假设之争

Dwarkesh Patel在访谈中,提出了一个清晰的逻辑链:AI芯片就像是浓缩铀——浓缩铀可以发电,但限制浓缩铀的流通,就能限制核武器的扩散。因此,限制高端AI芯片出口给中国,就能延缓中国大模型的发展速度;中国纵有强大的工程能力,也难以在算力落后的情况下追上通用人工智能的"奇点"。





他把AI竞赛定义为一场"谁先到达终点"的冲刺——终点是通用人工智能(AGI)或更远的超级智能。在这场冲刺中,任何能让对手减速的策略,都具有战略合理性。

或者,他把Anthropic封闭式发布的Mythos模型作为一个例子:如果中国也研发出类似的模型,能快速识别网络漏洞,岂不是可以攻击美国的网络?

这个假设,让黄仁勋罕见地情绪激动。



黄仁勋的核心论点,是这个比喻从根本上就是错误的。他没有选择正面辩论AI是否需要那么高的算力,而是直接拆解了Dwarkesh背后的逻辑链条:算力不是AI的唯一瓶颈,能源、架构、算法也是。

他的"五层蛋糕"框架,将AI产业从底层到顶层依次定义为:能源→芯片→基础设施→模型系统→行业应用。在这个框架里,芯片只是第二层,能源才是第一层。如果中国拥有丰富的能源,那么算力的差距可以通过其他方式弥补——比如用更多的芯片叠加、用更高效的算法降低单位算力成本。



更重要的是,黄仁勋认为摩尔定律正在走向终结——芯片性能每年翻倍的时代已经过去了,今天最先进的芯片,其性能优势不是永恒的护城河,而是有时间窗口的相对优势。一旦制程逼近物理极限,后来者的追赶难度反而会降低。

基于这两点,黄仁勋的结论是:限制芯片出口,短期确实会延缓中国AI的发展速度,但长期来看,这只会逼迫中国形成自己的生态链——一个内部整合、协同进化的完整体系。这个体系一旦形成,就不再需要依赖英伟达,也不再容易被外部力量切断。

而这,才是黄仁勋说出"灾难性"的真正所指。

而Dwarkesh的假设,恰恰是黄仁勋的反面:AI的终局是某种"超级智能",算力是到达终点的核心燃料,任何对算力的限制都能有效延缓对手。这个假设为出口管制的合理性提供了道德基础——"我们在争取人类未来的制高点,暂时的封锁是必要的代价"。

但这个假设本身成立吗?通用人工智能真的会以"超级智能"的形式出现,并成为某种决定性力量吗?这至今仍是一个无法证明,也无法证伪的信念,而非已经被验证的结论。黄仁勋对"核武器比喻"的愤怒,本质上是对这种未经检验的终极假设的拒绝。

即便是Mythos模型,黄仁勋并不认为是在最先进的芯片上训练出来的,也不认为Mythos模型的优势有那么大,扫描网络漏洞是AI模型发展史上必然会出现的一类功能,但还达不到所谓“核武器”的层级。

黄仁勋甚至认为很多政策是建立在极端假设上,而这些极端假设是带有一种“Loser”心态的,因为非常害怕输,所以就选择封闭别人。



从黄仁勋胀红的脸色上,可以知道他内心已经很激动,并对这些想法有种“恨铁不成钢”的感觉。





逐渐的,两种不同的竞争逻辑就体现出来了,一种是零和游戏逻辑,一种是共生竞争逻辑。


回到商业:一个无法回避的身份困境

访谈中还有一条更隐蔽的暗线:黄仁勋不希望把英伟达定义为"国家的武器"。

英伟达的市值已突破4万亿美元,但它始终强调自己是一家商业公司——卖芯片、建生态、服务客户、创造利润。但在现实中,它的一举一动都被华盛顿纳入战略框架:CHIPS Act补贴附带着"在美国制造"的义务;出口管制政策直接决定了它的中国市场命运;美国政府把它视为AI霸权的基础设施。

黄仁勋在访谈中说:"美国内部会优先获得最新芯片,不会影响美国的领先——而服务中国市场,是为了让英伟达的生态持续创新。" 至于如何避免最先进的芯片被用作军事用途,黄仁勋提出让两国的研发人员能保持更频繁的学术交流,设立机制以保证AI的使用在一定伦理内。

这句话的商业逻辑是清晰的,但政治逻辑更复杂。



当政策制定者把英伟达视为"等同于半导体国家竞争力"的存在,他们很难接受英伟达在赚取中国市场利润的同时,扮演"中立的商业角色"。你很难既被列为"国之重器",又保留完全的商业自主权。

这个张力,才是英伟达最深层的困境。


理解黄仁勋的真实立场

把整场访谈的逻辑梳理清楚之后,黄仁勋的立场可以概括为以下几个层次:

第一层:出口管制帮了谁?

短期确实帮了美国半导体设备商(向中国出售成熟制程设备),也让CHIPS Act补贴有了战略合理性。但对Nvidia本身而言,失去高价值市场是真实的商业损失。更关键的是:管制在战略层面的实际效果,并没有所谓"锁死中国",而是"逼迫中国整合成一个更有凝聚力的生态"。

第二层:AI竞争的终局是什么?

黄仁勋没有提到AI的终局是某种"超级智能奇点",也不认为芯片性能是决定胜负的唯一变量。他的"五层蛋糕"框架,本质上是说:AI是电力革命、互联网革命之后的下一代基础设施,它需要的是能源、芯片、基础设施、模型和应用的完整生态——在这个生态里,单一芯片的优势只是局部变量,不是决定性力量。


图源:网络

第三层:英伟达需要什么?

保持生态的开放性、保持对全球市场的服务能力、保持作为"商业公司"而非"国家工具"的身份——这是英伟达最核心的商业利益。

黄仁勋不希望英伟达成为那个被牺牲的代价。

黄仁勋所有的表态,都是围绕这三个核心利益展开的。


为什么CUDA是英伟达真正的护城河

理解黄仁勋的担忧,首先要理解英伟达的护城河到底是什么。

外界的普遍认知是:英伟达的护城河是GPU的硬件性能——芯片算力强、功耗低、生态好。这固然没错,但黄仁勋本人在这次访谈中给出了一个更底层的定义:

"输入是电子,输出是Token,中间是英伟达。"

这句话的意思是:英伟达真正的护城河,不是某一个芯片型号的性能指标,而是从电子到Token的整套转化体系的效率。硬件只是这个体系的最底层,往上是驱动层、编译层、框架层、工具链层和开发者生态层——五层叠加,才是英伟达真正的壁垒。

CUDA(Compute Unified Device Architecture)就是这个体系中承上启下的核心软件层。它不仅仅是"让GPU做并行计算的工具",而是一套定义了"如何用算力"的语言和规则体系。


图源:网络

全球数百万AI开发者,在研究生阶段就学习CUDA编程;他们的论文代码、实习项目、开源贡献,几乎全部基于CUDA生态构建。当一个毕业生在CUDA上训练了第一个模型,他的整个职业路径都会被锁定在这个生态上——换框架,意味着重写代码;重写代码,意味着放弃多年的积累。

更深的一层是:AI框架(PyTorch、TensorFlow)和优化库(cuDNN、TensorRT)都深度绑定CUDA。这意味着当研究人员说"这个模型在A100上训好了",他们实际上是在说"这个模型在CUDA生态里构建好了"。芯片可以换,底层生态迁移的成本却极高。

这就是为什么黄仁勋在访谈中说:"这些生态系统很难替代,换掉它们需要花大量时间和精力,而且大多数人根本不愿意换。"

他还提出了一套"AI五层蛋糕"理论自洽自己的逻辑:能源→芯片→基础设施→模型系统→行业应用。每一层都不是孤立的,而是彼此深度耦合。英伟达真正的优势,是在基础设施层和模型系统层,同时提供了硬件加速和软件工具的整合方案——这种全栈能力,是单一芯片厂商无法提供的。


中国是如何撕开这道裂缝的

黄仁勋口中"灾难"的触发点,是DeepSeek V4全面转投华为昇腾芯片。

根据多方报道,DeepSeek V4将首次完全基于华为昇腾950PR(配合中芯国际7nm制程)进行训练,底层代码从英伟达CUDA生态重写为华为自研的CANN框架。如果这一计划按期落地,DeepSeek V4将成为全球第一个完全脱离英伟达生态链路的头部大模型。


图源:网络

这一步的难度,不能被低估。这也是V4为何延后到4月底发布的原因之一。

从CUDA迁移到CANN,核心工作量相当于重写整个模型的底层算子库。DeepSeek团队在V3时期积累了大量的CUDA优化代码,这些代码背后凝结了团队对GPU硬件特性的深度理解。迁移到CANN,不仅仅是换一套API调用,而是需要工程师重新理解昇腾的架构特性,重新设计每一个计算内核的调度逻辑。

但DeepSeek选择走这一步,恰恰说明:迁移的代价,在战略收益面前已经变得可以接受。

撕开CUDA裂缝的力量,来自四个方向。

第一:华为昇腾的性能已经足够用了。

昇腾910C配合中芯国际7nm工艺,在推理场景下的性能已经可以对标英伟达H20。更关键的是,昇腾的硬件已经进入大规模量产阶段——2026年一季度,昇腾950PR正式发布并进入商用,国内外多个智算中心开始批量部署。

第二:CANN框架已经成熟到可以承接工业级模型。

CANN(Compute Architecture for Neural Networks)是华为自研的异构计算架构,定位对标CUDA。经过多年迭代,CANN在算子覆盖度、编译优化能力和调试工具上已经相对完善。DeepSeek V4若能成功迁移,说明CANN已经具备了承载顶级大模型的工程能力。


图源:网络

第三:中国AI生态正在形成完整的替代链。

芯片层:昇腾、寒武纪思元、燧原、沐曦、百度昆仑芯——五家主要厂商合计已占据国内市场41%的出货量(2025年数据);框架层:华为MindSpore、百度PaddlePaddle、阿里MQL;模型层:DeepSeek、通义、文心一言——越来越多的模型开始在国产算力上进行预训练。

第四:政策压力加速了迁移意愿。

2022年以来,美国商务部将昇腾系列列入实体清单,倒逼中国科技公司必须在国产芯片上实现技术自主。这种"被迫"的生态整合,反而在客观上加速了中国AI算力生态的内循环。

清华大学魏少军教授在一次行业会议上曾指出:"当前全球AI发展已被英伟达的GPU架构和CUDA生态深度绑定,形成了'模型-架构-生态'三重依赖。打破这种依赖,不是某一家公司的事,而是需要整个产业生态协同迁移。"

这条路的代价极高,但它正在发生。


这场突围,能走多远

黄仁勋的担忧,还提出了一个反直觉的论断:芯片不是AI的唯一瓶颈,能源才是。如果美国断供芯片,中国AI发展的天花板将由电力而非算力决定;能源丰富的中国,有能力自己解决电力问题,届时整个"芯片断供"的逻辑就会反转。

这个论断有它的合理性,但也有盲点。盲点在于:芯片的制程工艺,不仅仅是"买不买得到"的问题,更是"能不能造出来"的问题。中国目前最先进的制程是中芯国际7nm,而英伟达最新Blackwell系列已使用定制4nm/3nm工艺。芯片制造工艺的差距,不是两三年可以弥合的。

专家们的预测,大致可以分为两派。

一派相对审慎,认为中国AI芯片的"替代",更多是政治压力下的被迫选择,而非技术和商业上的自然结果。芯片性能的差距客观存在,软件生态的丰富度也远不如CUDA,短期内很难在英伟达传统优势的训练场景实现完全替代。这一派的代表是部分美国半导体行业分析师,他们认为英伟达的护城河依然坚实,"灾难性后果"是黄仁勋在政策游说时的夸大之词。

另一派则更为激进,认为中国AI生态的整合速度,已经超过了西方观察者的预期。DeepSeek V3已经证明了中国团队能在极低训练成本下做出顶级模型;同样的工程能力一旦迁移到昇腾生态,迭代速度会显著加快。昇腾950PR的实测性能,已经接近H20;按照摩尔定律,18到24个月内,昇腾与英伟达旗舰芯片的性能差距将进一步缩小。



图源:网络

一个更值得关注的技术趋势是:DeepSeek证明了,算力效率可以弥补芯片性能的差距。 DeepSeek V3用557万美元完成了与GPT-4比肩的训练,其核心方法正是极致的算力利用率优化。这意味着,即便中国芯片性能只有英伟达的70%,通过算法优化,差距可以被大幅压缩。


一场没有终点的生态战争

回到黄仁勋那句话。

"如果DeepSeek先在华为平台上发布,那对我们国家(美国)来说将是灾难性的。"

这句话的语境,不应该被简化为"黄仁勋害怕华为"。它背后真实的焦虑是:英伟达最害怕的,不是华为做出一款好芯片,而是中国通过政策压力+市场整合+技术迭代,形成一个能够自我进化的AI算力生态闭环。


图源:网络

芯片禁运的政策压力,反而加速了这个闭环的形成——这个逻辑反转,是黄仁勋"灾难"二字的真正所指。

对于中国而言,目前还不意味着胜利。英伟达的护城河,并非一纸禁令就能拆除。CUDA生态积累了十五年的开发者心智和使用习惯,不可能在一夜之间迁移;国产芯片在制程工艺、工具链成熟度上,与英伟达的差距依然显著;完整的替代生态,需要芯片厂商、模型厂商、云服务商和终端用户的协同共进,这是一场以十年为单位的耐力赛。

但趋势的方向已经确认。

当DeepSeek V4全面适配昇腾的那一刻,那不只是一个模型的迁移,而是一张多米诺骨牌的倒下。第一个吃螃蟹的人已经出现了,跟进者会越来越多。

黄仁勋的"灾难",或许不会在一夜之间降临。但它描述的未来,正在以肉眼可见的速度,逼近现实。

本文核心信息来源:Dwarkesh Patel播客专访黄仁勋全文(2026年4月15日),建议大家可以去看原视频,信息更丰富;IDC 2025年中国AI加速芯片市场报告;华尔街见闻、财经十一人、芯东西等媒体对访谈的系统整理。