(原标题:H20获得“口头放行”之后,英伟达需要重新认识中国市场)图片来源于网络,如有侵权,请联系删除
经济观察报记者 郑晨烨图片来源于网络,如有侵权,请联系删除
7月15日,英伟达(NVIDIA)创始人兼CEO黄仁勋现身第三届中国国际供应链促进博览会。这已是黄仁勋在2025年内第三次到访中国大陆,就在几天前的7月9日,他执掌的英伟达,市值盘中突破4万亿美元大关。
同日,根据英伟达官方微信公众号发布的信息,英伟达正在提交重新销售NVIDIA H20 GPU 的申请,“美国政府已向英伟达保证将授予许可证”,并且英伟达希望尽快启动交付。H20是英伟达此前“特供”中国市场的一款AI芯片,今年4月被美国政府列入出口管制。
英伟达在文中同时强调了其在美国“加强AI基础设施”的努力,以及在中国“探讨AI如何提高生产力”的意愿。
为“合规”而生的H20
H20芯片的诞生背景,可直接追溯至2023年10月17日。
彼时,美国商务部工业与安全局(BIS)发布了更新的出口管制最终规则,该规则对销往中国的先进计算芯片,设置了两道核心的、量化的技术红线。第一道红线是“总体处理性能”,用以衡量芯片的综合原始算力;第二道红线则是“性能密度”,即总体处理性能与芯片面积的比值,旨在限制通过芯粒(Chiplet)组合方式绕开管制的能力。
这两项指标的设定,将英伟达当时最畅销的H100、A100以及H800、A800等数据中心GPU产品,挡在了中国市场门外。
作为应对,英伟达迅速调整其产品策略。2023年11月,根据公开报道,英伟达已开发出三款专为中国市场设计的新芯片――H20、L20和L2,其核心设计目标,就是严格遵照BIS设定的技术参数框架,确保产品合规。其中,作为面向AI训练任务的旗舰型号,H20的公开规格参数,清晰地反映了这种“合规”的内在逻辑,它与被禁售的H100同样基于Hopper架构(英伟达推出的一种GPU架构),但在关键性能上进行了精确的调整。
在算力性能方面,H20的FP16/BF16(半精度浮点)算力为148 TFLOPS(每秒万亿次浮点运算)。作为对比,被限制的H100芯片在同等精度(FP16)下的算力高达1979 TFLOPS。尽管性能差距显著,H20的总体处理性能(TPP)经计算后低于美国商务部工业与安全局(BIS)设定的4800 TPP管制红线,从而达到了“合规”标准。
显存配置是H20少数未被削减的环节,其HBM3显存容量从H100的80GB增至96GB,显存带宽也由3.35 TB/s提升到4.0 TB/s。芯片间的互联性能,则是H20最受关注的环节之一,其单卡NVLink(英伟达开发的一种高速互连技术)互联总带宽为900 GB/s,与H100的规格持平,这保证了服务器节点内部的GPU间通信效率。
然而,真正的瓶颈在于跨节点的集群互联能力,由于美国对高速网络设备同样存在出口管制,中国客户将难以获得用于构建DGX SuperPOD级别集群的NVIDIA Quantum-2 InfiniBand网络方案――该方案能为每个服务器节点提供高达400 GB/s(即3.2 Tb/s)的外部互联带宽。
对于需要数千颗GPU互联以训练大模型的中国云厂商而言,外部互联能力的缺失,意味着组建超大规模集群的通信效率将大打折扣,难度与成本也随之显著增加。
从产品立项到正式获得销售许可,H20的问世之路并不平坦,该芯片原定于2024年初上市,但其面市时间一再推迟,市场普遍认为,延迟的原因在于该系列芯片需通过美国政府的额外审核程序。这漫长的等待,直至2025年7月15日英伟达官方宣布获得“保证”,才算告一段落。
“保证”之下的市场挑战
英伟达官方信息中“保证将授予许可证”的表述,在商业层面意义重大,它为英伟达在中国市场启动一系列商业活动提供了必要的基础,这意味着,英伟达可以正式与中国客户就H20的销售进行谈判、签署意向订单、进行产能规划和供应链准备。
与此同时,英伟达也亮出了其多产品策略的另一环。英伟达在官方公众号的文章中同时宣布,将推出一款“全新且完全兼容”的NVIDIA RTX PRO GPU,该产品“是为智能工厂和物流打造数字孪生AI的理想选择”。
在高性能计算芯片受限的背景下,转向工业AI应用领域,不仅符合中国推动制造业升级和“新质生产力”发展的宏观政策方向,也因其应用场景的特殊性,面临相对较低的出口管制风险。数字孪生、工业自动化等市场,或将成为英伟达在中国寻求更稳固业务的突破口。
然而,无论是H20的“有条件回归”,还是RTX PRO的“新路开拓”,都无法回避一个已然改变的市场现实――激烈的本土竞争。
在美国出口管制政策的窗口期内,中国本土AI芯片产业获得了加速发展的空间。
最直接的体现是市场份额的变化。根据...