上代旗舰难救火,国产算力市场大势不变 | 图源:豆包 AI

作者/  IT 时报   毛宇

编辑/   郝俊慧   孙妍

12 月 8 日,特朗普在社交媒体抛出重磅消息:美国将允许英伟达向中国 " 经批准的客户 " 出售 H200 人工智能芯片,芯片销售收入的 25% 将上缴美国政府。

传闻终于靴子落地。

" 英伟达不单单想要抢回中国市场份额,同时也想清掉 H200 的库存。" 一位芯片行业人士向《IT 时报》记者直言。

此时的 H200 已非英伟达的旗舰产品——基于全新 Blackwell 架构的 B300 芯片已下产线,美国市场主流产品早已迭代为 GB200 及 B200/B300 8 卡机集群,H200 所剩库存在美国市场很难被完全消化。那么,卖给中国,是个好点子。

今年 10 月,英伟达董事长黄仁勋曾公开表示,由于美国政府的出口管制,英伟达已经完全退出中国先进 AI 芯片市场,市场份额 " 从曾经的 95% 暴跌至 0"。

英伟达急需抢回中国市场份额,但这场 " 开卖 " 大戏的悬念并未就此落幕。从特朗普官宣到具体措施落地的缓冲期内,美国内部对于芯片出口中国的激烈争议尚未弥合,政策生变风险如影随形。

更关键的是,H200 与新一代 B300 存在巨大性能代差,且中国市场供需格局已发生深刻变化,即便顺利入华,也难改国内 AI 算力发展的基本盘。

英伟达 B300

中国算力需求将进一步分层

H200 入华的核心吸引力,并非其硬件性能,而是背后根深蒂固的英伟达 CUDA 生态。

" 据我们了解,已有国内大厂准备下单近 10 万片 H200,但国内大厂愿意买,还是因为 H200 可以做到即插即用。" 上述行业人士指出,CUDA 架构通过十余年积累,已形成从开发工具到应用场景的完整闭环,成为 AI 训练的 " 基础设施 ",这是国产芯片短期内难以企及的优势。

英伟达 H200

当然,相较此前的阉割版 H20,H200 的性能高出不少。据美国乔治城大学新兴技术与安全中心(CSET)测算,H200 的总处理性能(TPP)约为此前对华出口管制上限的 10 倍,H200 在训练和推理 175B 以上参数大模型时,性能是 H20 的 6 倍以上。

这个消息在 12 月 11 日得到侧面印证。路透 . 社援引知情人士的话称,字节跳动和阿里巴巴已向英伟达咨询 H200 采购事宜,若获得政府批准,二者计划大额下订单,但担忧供应问题,正寻求英伟达明确答复。

不过这种吸引力仅局限于少数头部企业。

当前国内 AI 算力需求呈现明显分层趋势。从事大模型训练的大厂屈指可数,且普遍囤积了 HBM 显存等关键物料,H200 可作为现有算力集群的补充;占市场多数的中小型厂商主攻推理场景,对高端算力需求有限;政府和特定垂直行业的云服务商和客户,则依然会坚定采用国产算力芯片。

" 此前通过各种渠道流入的 H200 等英伟达芯片已基本能满足其需求,H200 难以形成新的增量市场。" 上述行业人士表示,现有国产芯片如华为昇腾 910B、910C 已量产,在成本允许的情况下,已可实现有效推理,并与英伟达 A 系列对标。

短期影响有限。H200 入华的审批和采购流程至少需要 2 至 3 个月,这意味着短期需求仍将倾向于国产芯片。

不过,从中长期来看,市场细分化趋势可能出现。尤其是国产芯片的量产环节仍受掣肘。今年 10 月,寒武纪发布的第三季度财报出现营收与净利润双下滑,多家券商分析认为,这与中芯国际产能受限密切相关。寒武纪在某次公告中也特别提到 " 面临供应链稳定性风险 "。

" 寒王 " 尚且如此,更别提其他国产芯片厂商。

这种供需错配,使得 H200 虽非顶尖产品,仍能在特定领域找到市场空间。

上述人士称,假设没有政策限制,H200 最早应在 2026 年第一季度或第二季度初大规模进入中国市场。

国产芯片

稳定性比高参数更重要

若以性能维度审视,H200 与即将发售的 B300 早已不属于同一时代,甚至逊于 AMD 的 MI355X 和谷歌的 TPU V7。

" 美国政府不会同意英伟达最先进的 B 系列进入中国市场。" 上述行业人士一语中的。

含直流电源组件的 DGX B300 爆炸视图

作为英伟达上一代 Hopper 架构的 " 末代旗舰 ",H200 虽在 H100 基础上升级至 141GB HBM3e 内存与 4.8TB/s 带宽,使 Llama 2 大模型输出速度提升至 H100 的 1.9 倍,但在英伟达最先进 Blackwell 架构的 B300 面前,已尽显颓势。

实测数据显示,在相同测试环境下,B300 单并发推理吞吐量达 441 Token/s,7037 并发时更是飙升至 52977 Token/s,分别是 H200 同场景性能的 2.79 倍和 3.6 倍;在时延表现上,B300 单请求时延仅 4.5 秒,远低于 H200 的 12.9 秒。在核心的 FP16 稀疏算力指标上,B300 单卡算力达 320 PFLOPS,是 H200(1.98 PFLOPS)的 161.6 倍,这种代差直接决定了二者应用场景的分层。

但这款 " 性能巨兽 " 并无对华发售计划,美国仍在试图通过技术代差维持 AI 优势。

H200 的 " 放行 ",更像是在不威胁核心技术壁垒前提下的商业妥协——毕竟在黄仁勋看来,美国的出口管制已 " 完全失败 ",反而倒逼着中国芯片自主发展。

国内资本市场的反应印证了这一点:" 国产 GPU 第一股 " 摩尔线程登陆 A 股五日(截至 12 月 11 日中午 11 时 30 分),股价已突破 800 元,总市值飙升至 3900 亿元;沐曦 IPO 中签率仅 0.033%,创下新股申购中签率新低,有传言称曦云 C700 性能已接近 H100,C600 更具备替代 H20 的能力。" 除华为外,目前沐曦的芯片性能是靠前的。" 亦有业内人士向《IT 时报》记者透露。

显然,H200 解禁并非 " 狼来了 ",反倒成了检验国产芯片竞争力的试金石。

资本市场很清楚,在一个充满不确定性的国际环境中,稳定性比那些花哨的性能参数更重要。

正式入华前

争议犹存 落地风险待解

特朗普的官宣并未终结美国对华芯片政策的摇摆。

事实上,关于是否放松出口管制,美国政府内部始终存在巨大分歧:其国家安全部门担忧技术扩散,而产业界则焦虑失去中国市场——毕竟仅靠美国本土无法支撑芯片企业的研发投入与产能消化。

今年 5 月,美方曾修改对华芯片管制表述,将 " 禁用 " 调整为 " 风险警告 "。

上述业内人士预判,即便 H200 顺利放行,后续仍可能面临出口许可证审批、销售范围限制等多重关卡," 从官宣到实际放行的缓冲期内,任何风吹草动都可能引发政策转向 "。

对于英伟达而言,这场 " 清库存 " 行动也暗藏风险。一方面,其需在满足美国政府条件的同时争取中国市场信任,此前 H20 芯片曾因安全漏洞被约谈;另一方面,若政策再度收紧,其可能陷入 " 库存未清、信任已失 " 的尴尬境地。黄仁勋此前的表态透露其担忧:" 失去中国市场,美国或将无法维持在 AI 领域的主导地位。"

图源:豆包 AI

回到最初的问题:H200 的 " 松绑 ",究竟是中国 AI 产业的及时雨,还是一颗包裹着糖衣的 " 软钉子 "?答案可能比人们想象得更复杂。

从技术角度来看,H200 为中国 AI 产业提供了一次技术补给的机会。在当前国产芯片还在追赶的关键阶段,获得 H200 这样的成熟技术,对于缓解算力紧张、提升研发效率都有积极作用。特别是对于正在大规模训练 AI 模型的企业而言,H200 的可用性能够为它们提供更多的技术选择。

但从战略角度来看,美国政府对先进算力芯片态度的反复横跳也提醒行业,过度依赖外部技术,可能会制约长期的技术创新能力。

在 AI 这个关键赛道上,中国需要做的不是在等待中焦虑,而是在行动中坚定前行。