2025 年 6 月 18 日 下午 3:27

黄仁勋需要让英伟达再次伟大


文  | 硅基研究室,作者 | kiki  谢浩

比起去年把 Transformer 八子、OpenAI、xAI 等明星企业攒到一起,今年的英伟达 GTC 似乎狂热稍减。

但这并不影响黄仁勋的 AI 叙事,在美国加州圣何塞,「英伟达绿」 依旧是科技圈的符号。除了现场超 2 万人的围观,成千上万的人在线观看黄仁勋的主题演讲,他说了什么、英伟达会干什么,这些都会成为人们判断 AI 时代的依据。

不过,比起预测未来,今年 GTC,黄仁勋可能干的最多的是重复和反驳—— 比如 「买得越多,省得越多,甚至比这更好—— 买得越多,赚得越多」,这是经典的黄式定律,再比如 「几乎全世界都误解了 Scaling Law 放缓」。

也许是这些重复叙事,没能带来更多的效果,对于英伟达 GTC 大会发布的一系列产品,华尔街的态度反响平平,英伟达盘后股价下跌了约 4%。

我们整理出这届 GTC 黄仁勋最想对市场说的三个关键真相。

1、53 次 token,捍卫 Scaling Law 的信仰

黄仁勋演讲里有个隐秘的主题——tokens,他在自己的演讲里至少提到了 53 次。

如此反复强调 tokens,某种程度上黄仁勋在说 Scaling Law 没有终结,源源不断的 tokens 消耗,就能带来持续的算力需求,这是英伟达讲述一切增长的前提。

他给出一组数据,随着 Agentic AI 和推理能力的发展,目前所需的计算量是过去的至少 100 倍。

给予黄仁勋信心的是英伟达 GPU 的下游应用场景—— 主要包括数据中心、汽车领域、机器人等,科技巨头、云厂商和算力租赁服务商都会大笔采购英伟达的先进芯片建设 AI 基建。

黄仁勋曾这样形容:“ 英伟达不造芯片,英伟达造数据中心”。

遵循这一认知,黄仁勋公布了一组数据,2024 年,美国 Top4 云公司总计采购了 130 万颗 Hopper 架构 GPU,到了 2025 年,这一数据飙升至 360 万颗 Blackwell GPU,他预计数据中心建设的价值将达到 1 万亿美元。

面向这些云厂商等企业端客户,英伟达主要出售的是包括 AI 服务器、高速交换机等 AI 算力集群服务,英伟达所提供的是系统和网络、硬件和软件等方案。

与此前的 AI 服务器 GB200 NVL72 一样,英伟达公布了新产品:Blackwell Ultra NVL72 机柜,黄仁勋特别强调这是 「AI 推理专用机柜」。

天风证券分析师郭明錤曾提到,影响英伟达 AI 服务器增长的一个重要因素是,它能否提供算力更强且平均 token 成本更低的 Scale-up?

至少从英伟达提供的数据来看,黄仁勋已想到了这一点:相比前一代产品 GB200 NVL72,带宽是前代的两倍,内存速度是前代的 1.5 倍,同时由于因机柜尺寸和电源规格相似,这对科技公司的数据中心升级而言,有着一定的性价比优势。

不过黄仁勋没说的是,英伟达数据中心业务的暴涨年代已经过去了。单从财报看,英伟达数据中心业务已结束了六个季度以来连续保持的 「三位数高增」,环比下降趋势也十分显著。

郭明錤还提到,英伟达数据中心业务目前存在的问题是 「量产的能见度不高」,英伟达需要更多具体列举数据中心部署 GB200 NVL72 的案例,以及客户转换到新产品的具体效益情况。

2、下一代芯片:黄式定律能否有效?

除去行业宏观层面,对 Scaling Law 的展望,过去的几个小时里,花费 1 万美金购票入场的技术信徒们,还在期待另一个问题的答案:

“ 黄氏定律” 能否延续。

作为英伟达首席科学家所提出的,对后摩尔定律时代的重要补充,黄氏定律表明:GPU 架构、软件的革新将推动 AI 性能实现每年翻倍。

如果说 Scaling Law 关注的是“ 行业需不需要更多 GPU”,那么黄氏定律所传达的内容则更为直观—— 行业需不需要英伟达。

尽管从目前的市场趋势来看,Blackwell 取得了远超于 Hopper 架构 GPU 的市场成绩,并直接带动了 AI 领域基建的新一轮繁荣,参考黄仁勋本人的说法:“Blackwell 开始出货的一年内,你能看到人工智能基础设施建设出现了难以置信的增长。”

但股价的下跌还是侧面传递出了市场的不满情绪。 

这一不满情绪的源头,很大程度上来自于年度算力“ 核弹”——Blackwell Ultra GB300 的不佳表现。

这颗被外界寄予厚望的芯片,并未能重现 Blackwell 架构横空出世时的惊艳感,反而更像是上一代芯片的内存“ 超大杯” 版本。 

虽然黄仁勋并未对比两代 Blackwell 产品间的性能差异。但根据此前英伟达官方透露的信息显示,单个 Ultra 芯片将提供与 Blackwell 相同的 20 petaflops 的 AI 性能,HBM3e 内存从 192GB 升级到了现在的 288GB。 

似乎是为了补救现场用户的失望感,老黄直接趁势预告了明年上市的新一代 Rubin 架构 GPU,并表示,新一代 GPU 的性能预计是 Blackwell Ultra NVL72 的 3.3 倍。 

但很显然,这种画饼行为并没有得到市场的认可。原因也很简单,想象一下库克在苹果发布会上掏出一部 4TB 版本的 iPhone16 告诉大家,这就是本届发布会的新品,顺便再吹一波 iPhone18 的性能—— 对比往期发布会上的遥遥领先,至少在今年,黄氏定律在硬件侧,短暂按下了暂停键。 

相比之下,软件侧的 Nvidia Dynamo,反而成为了黄氏定律续命的关键。

作为业内人士口中,英伟达“ 在推理领域构建的新 CUDA”,Nvidia Dynamo 绝对担得起发布会王炸的头衔。 

作为一个专为推理、训练和跨整个数据中心加速而构建的开源软件。Dynamo 的性能数据相当出色:在 NVIDIA Hoppe 平台上,软件能够在同样的 GPU 前提下,将 AI 工厂的性能和收入提高一倍。而在 GB200 NVL72 机架集群上运行 DeepSeek-R1 模型时,生成的 token 数量更是进一步被提高了 30 多倍。 

从黄仁勋的演讲细节来看,他对这款产品的表现也非常满意,在介绍完相关性能后,他甚至轻松地和现场开启了玩笑: 

“ 这就是我以前为什么说,当 Blackwell 批量发货时,你不要把 Hopper 送人。”

3、从 DeepSeek 到大厂,黄仁勋的 「中国朋友圈」

本届 GTC,「中国元素」 浓度也很高。 

长达两个小时的演讲里,句句不离推理的黄仁勋当然会提到 DeepSeek,他将 DeepSeek R1 模型称为 「卓越的创新」 和 「世界级的开源推理模型」。 

事实上,在 ChatGPT 尚未诞生的 2022 年,幻方 AI 就受邀在黄仁勋的 GTC 舞台上演讲。 

此次 GTC,黄仁勋又秀了一次自己的 「中国朋友圈」。

在主题演讲的前一天,GTC 特别举办了 China AI Day-云与互联网在线中文专场,包括火山引擎、阿里云、百度、蚂蚁集团、京东、美团、快手、百川智能等中国企业分享了其在大语言模型、多模态大语言模型、数据科学和搜推广领域的前沿进展。 

大半个中国智驾圈也齐聚 GTC,除此以外,据 「硅基研究室」 不完全统计,联想、比亚迪、文远知行、阿尔特、工业富联、九号公司、完美世界、银河通用等中国企业均相继宣布与英伟达的最新合作。

尽管饱受地缘政治影响,但英伟达始终关注中国市场的一举一动。今年年初的例行中国行中,黄仁勋连续走访了多个中国城市,和中国合作伙伴同桌共饮。 

从科技历史来看,三次技术浪潮诞生了三家市值超三万亿美元的公司,他们是微软、苹果和英伟达,随着英伟达成为这个时代最伟大的企业之一,GTC 大会已不仅仅只是黄仁勋的个人秀,而是整个 AI 圈的文化符号。 

人们对文化符号自带信仰和高预期,就像华尔街对英伟达的期待一样:人们的恐惧是,如果英伟达也不能讲出新故事了,那么下一个英伟达在哪里呢?

更多精彩内容,关注钛媒体微信号 (ID:taimeiti),或者下载钛媒体 App

- Advertisement -spot_img

推荐阅读