两年来,许多云计算和芯片行业高管们都在预测,英伟达在人工智能服务器芯片领域的主导地位将会下降,但这一情况似乎尚未发生。
北京时间 2 月 27 日,英伟达公布了 2025 财年第四季度财报,业绩再次超出华尔街预期。财报显示,英伟达第四季度营收达到创纪录的 393 亿美元,较上一季度增长 12%,较去年同期增长 78%。净利润高达 220.91 亿美元,超过市场预期的 196.11 亿美元。整个财年营收增长 142%,达到创纪录的 1,152 亿美元。
(来源:英伟达)
数据中心业务依然是英伟达收入的主力军,特别是在 AI 训练和推理需求激增的背景下,第四季度数据中心营收创下 356 亿美元的新纪录,环比增长 16%,同比增长 93%。这主要得益于 Blackwell 计算平台的强劲需求,以及 H200 产品的持续增长。
不过,需要注意的是,虽然各季度营收额持续攀升,但同比增长率却呈现下降趋势。这次英伟达第四季度的营收同比增长率仅为 78%,创下七个季度以来的最低水平。或许英伟达未来的发展,已经不如以前那么轻松了。
Arm 控股公司 CEO、软银董事会成员 Rene Haas 就认为,尽管英伟达目前在 AI 芯片市场占据主导地位,但其他 AI 芯片的销售增长也只是时间问题。在接受 The Information 采访时,Haas 分享了他对 AI 芯片市场竞争格局的看法。
“随着众多大型 AI 开发商和云服务提供商积极开发英伟达芯片的替代品,专门化的推理芯片将逐渐出现。”Haas 表示。
至于哪些挑战者最有可能成功,Haas 尚无定论。他认为芯片创业公司、亚马逊等云服务巨头、OpenAI 等新玩家和传统芯片厂商都有机会。这是因为像 OpenAI 这样的公司在运行现有 AI 模型(即推理)上的支出最终将超过训练新模型的投入,而英伟达的芯片主要在训练领域有绝对优势。那些计算强度相对较低的推理任务,恰恰为英伟达的竞争对手提供了市场空间。
以下是采访内容:
The Information(以下简称 TI):上周,我们报道 OpenAI 预计其在推理计算(运行 AI 模型)上的支出,将在 2030 年超过其在训练模型上的支出。这与您的预测一致吗?
图丨相关报道(来源:The Information)
Haas:如果你认同某个时间点训练新模型的收益会逐渐平缓,主要工作转为强化训练而非开发全新的前沿大模型。不管这个转折点是五年后还是十年后,这都是个值得思考的判断。我们暂时先假设 OpenAI 的预测是对的,届时就会有一个拐点,推理将成为绝对主导的工作负载。
目前我们距离 AGI(artificial general intelligence,通用人工智能)还很远。我今早看到一些报道说 AI 编程助手多么厉害,能通过某些数学测试,但它们真能写出媲美中级工程师水平的代码吗?当 AI 达到这种水平时——虽然大家对 AGI 的定义各不相同——你才会发现我们真正取得了突破。显然我们还没到那一步,这也是为什么人们在训练上投入如此巨资。
所以不管这个转折点是不是 2030 年,我认为发展曲线大致会是这样的。
TI:长期来看,公司是否会在英伟达 GPU 上运行 AI 推理?
Haas:现在下结论还为时过早,因为目前市场上绝大部分已部署设备都是英伟达的。大型云服务商的推理任务几乎默认都跑在英伟达硬件上。像 Cerebras 和 Groq 这样的小型芯片公司在中小型数据中心的推理市场取得了一些成功,但有些客户只是因为买不到英伟达 GPU 才被迫选择替代品。
图丨 Groq 的 AI 芯片 LPU 与英伟达 GPU 的对比图(来源:Groq)
目前市场还处于早期阶段,因为很多企业在考虑:“我已经在 GPU 训练上投入巨资,数据中心硬件成本已经沉没,不确定是否值得为推理任务更换其他公司的芯片。”但我认为未来几年,随着模型规模不断扩大,越来越多的投资会流向专用训练 GPU 或解决方案,届时市场将出现明显分化。
专用推理产品将逐渐兴起。各大云服务巨头都在研发自己的芯片。我不便透露保密信息,但我们对这些产品都有深入了解,在很多场景下,CPU 能发挥很大作用。
TI:谁能从英伟达手中抢夺推理市场份额?
Haas:现在很难预测哪家会胜出。毫无疑问,英伟达是家了不起的公司,在已部署基础设施方面优势明显。
但另一方面,芯片创业公司在创新方面动作不断,无论是光纤基板、共封装光学技术、创新内存配置还是存内计算——半导体行业正经历多年未见的创新活力。
TI:大型云服务提供商的自定义 AI 芯片前景如何?
这条路确实很难走。我们在通用计算芯片方面积累了丰富经验,比如亚马逊的 Graviton(非 AI 任务芯片)以及微软和谷歌的 AI 芯片。Graviton 已经获得了不少市场认可,但微软和谷歌的 AI 芯片尚未得到广泛应用,这需要很长时间。最大的挑战在于,AI 模型发展速度远快于硬件迭代,云服务商想自研芯片难度极高。
TI:你对 OpenAI 正在开发的芯片有什么看法?
Haas:这个我不便评论,因为你知道的,如果这些公司在研发定制芯片,很可能正在与 Arm 合作。
TI:有报道称 Arm 也将在今年推出 AI 芯片,是这样吗?
Haas:我可以向你保证,如果我们准备这么做,你会是第一个知道的。
TI:埃隆·马斯克的 xAI 对 AI 基础设施有何影响?
Haas:可能比任何事情都更重要的一点是马斯克用一个相当快的速度建立起了 Grok。我认为这对整个生态系统施加了巨大的压力。
图丨 xAI 短短八个月建立起的 Colossus 超算(来源:xAI)
TI:未来会有更多类似 Stargate 的项目吗?
Haas:我不确定软银能否再投入更多类似 Stargate 的项目,但就这个想法而言,这是个好问题。孙正义很早就洞察到了关键:你需要资金,也需要其他资源。鲜为人知的是,软银拥有规模庞大的能源业务,为谷歌和微软等科技巨头提供了大量服务。
软银还带来了许多特殊资源,包括 Arm 和众多技术合作伙伴。这正是成功所需的关键要素。仅靠资金融资而不提供技术支持,成功会很困难。我相信会有其他人尝试,但要整合所有资源绝非易事。
TI:AI 推理将主要在数据中心运行还是在边缘设备上运行?
Haas:边缘设备承担重要 AI 任务并非不可能。我认为未来会是混合模式——部分在云端运行,部分在本地执行。从隐私和安全角度看,某些任务你会希望在本地处理。甚至是更小的设备,比如耳机,功耗严重受限。因此,AI 算法和相关计算必须变得更加高效。
TI:最适合 AI 运行的设备是哪一类?
Haas:手机本身已经是非常高效的产品,功能丰富。过去十几年,手机教会我们一个道理:人们不喜欢携带多个不能显著提升体验的设备。
因此,必须是能增强现有体验的产品。可能是智能服装吗?确实有可能。智能眼镜领域也在快速发展。关键是产品体验必须自然。我能想象的是作为配件,为现有设备提供某种增强功能。但我还没看到那种让人“非拥有不可”的 AI 设备。
参考资料:
1.https://www.theinformation.com/articles/why-arms-ceo-sees-room-for-nvidia-competitors?rc=a4cwro
运营/排版:何晨龙