出品 | 虎嗅科技组
作者 | 丸都山
编辑 | 苗正卿
头图 | 视觉中国
一个月前,当Ilya在NeurIPS上宣布“预训练即将终结”时,他可能无法预料到,这番表态不仅没有让业界陷入迷茫,反而掀起了另外一场狂欢。
博通成为第一个吃到肉的公司。
就在NeurIPS开幕的前一天,12月13日,ASIC芯片巨头博通发布四季报,虽然经调整净利润33%的增长不算特别“唬人”,但CEO陈福阳关于大客户将在2027年花费600至900美元购买博通AI组件的预测,还是让这家公司在次日的股价暴涨24%,成为第9家市值突破万亿的美股公司。
而在大洋彼岸的中国,ASIC概念股也再度被拉回人们的视野,包括寒武纪、芯原股份、灿芯股份等公司成为投资者热捧的对象。
虽然A股市场素来不缺乏盲目追逐热点的案例,但这一次,国内ASIC芯片厂商确实有比较坚固的基本盘。
一位产业投资人向笔者表示,“国内头部CSP(云解决方案提供商)公司都在自研ASIC芯片,而且是每一家,他们都需要第三方芯片设计公司的帮助。”
这并不难理解。就像谷歌与博通携手打造的自研TPU一样,谷歌可以为其设计架构,但关于IP核授权和版图设计的工作,还是需要博通来完成。
但问题是,国内CSP厂商会选择国内ASIC芯片设计公司吗?
这位产业投资人认为,“产品组合、IP核库、设计复用度,还有软件生态,在这些维度上,国内ASIC厂商与博通、Marwell等巨头存在着较为明显的差距。”
而一个更加宏观的问题是,即便行业公认预训练结束,高举ASIC大旗的博通,真的能推翻“英伟达叙事”吗?
博通的底气,从何而来?
在博通财报发布后的电话会议上,陈福阳表示,在2024财年博通AI相关的半导体总营收为122亿美元,按照博通的业务结构划分,这部分收入除ASIC芯片外,应该还包括以太网交换芯片、PHY芯片等等。
即便把122亿全部算在ASIC芯片的营收上,陈福阳的预测也是非常夸张的。如果取900亿美元的上限计算,那么未来三年,博通在ASIC芯片上的年复合增长率将达到惊人的170%。
作为对比,英伟达从2022年-2024年营收的复合增长率在110%左右。
为什么陈福阳对ASIC市场会如此乐观?
这里先说下ASIC芯片的定义。ASIC,即专用集成电路(Application Specific Integrated Circuit),是为特定用户或特定电子系统制作的集成电路。
从广义上来讲,可以理解为用户对产品的功能、成本、体积等要求进行专门设计的芯片,这个语境下,汽车上用于发动机控制的芯片都可以视为ASIC芯片。
而目前用于AI行业的ASIC芯片,主要针对人工智能相关的算法和任务进行设计,以用于加速人工智能的训练和推理过程。
听起来和GPU好像有点类似?
与后者相比,ASIC专为特定推理任务而定制,不需要像GPU那样为了适应各种不同的任务而进行频繁的配置和切换。
同时,因为ASIC芯片只包含完成特定推理任务所需的功能模块,不需要像 GPU 那样集成大量的通用功能和接口。比如在一些简单的图像识别推理应用中,ASIC芯片完全可以去掉GPU中那些用于复杂图形处理和游戏渲染的模块,从而降低芯片成本。
另外,在推理端,设计厂商会针对卷积、矩阵乘法等常见运算设计专门的电路模块,在执行推理任务时,这些模块避免了冗余计算和不必要的电路切换,使功耗大幅降低。
目前业内主流观点认为,在负责的大规模数据中心的推理任务中,使用ASIC芯片可以将功耗降低30%-70%;如果在边缘计算等简单数据场景中,ASIC芯片甚至可令功耗下降一个数量级。
值得一提的是,在去年年底,红衫曾发布过一份名为《AI in 2025:Building Blocks Firmly in Place》的报告,其中有一个观点非常有趣:
现在的Software-as-a-Service未来将转向Service-as-a-Software。在AI应用上,就是未来“按成果收费”将取代现在的按“座席收费”。
如果AI行业会如同红衫预料的那样发生改变,那么在配置相对弹性的推理端,各厂商毫无疑问地会“疯卷成本”。
在这样的背景下,ASIC芯片的意义不言自明。
替代英伟达?为时尚早
实际上,互联网大厂对ASIC芯片的关注并不比GPU晚多少。
其中最具代表性的是谷歌。早在2015年,谷歌就开发出了第一代TPU处理器(ASIC的一个分支),虽然彼时外界对这个项目的了解并不多,但驱动AlphGo击败李世石的,就是这枚芯片。
此后8年,在博通的帮助下,谷歌TPU又迭代了6个版本。
2023年12月,多模态大模型Gemini 1.0横空出世,谷歌在I/O大会上表示这个大模型的训练和推理100%由TPU V5e和TPU V4完成。
当然,这并不代表TPU在大模型训练上也有优势,只是对于谷歌来说,并不想看到英伟达在硬件平台上“赢者通杀”。
除了谷歌外,Meta和字节跳动也在通过博通“自研”ASIC芯片,虽然后者曾官方否认过与博通的合作,但有业内人士指出,字节跳动的ASIC芯片最早在今年年底就能看到回片。
不过,在博通与这些大厂的合作中,也能看到目前ASIC芯片几个明显的短板。
首先就是,至少在现阶段,各家定制/自研的ASIC芯片还谈不上节省成本,而且开发周期漫长。
比如谷歌的TPU项目始于2015年,但真正能用于大模型训练/推理的芯片直到2022年才出现(TPU V4),虽然理论上ASIC芯片适用于特定的推理任务,功能更加简单,但实际上的设计门槛非常高。从流程上来讲,需要从最基本的系统规格定义、逻辑设计上入手。
另外,相较于英伟达的GPU,无论是博通还是Marvell,都显然缺少像CUDA那样丰富且易上手的软件生态支持,在涉及卡间互联和智算中心的搭建的问题上,也没有类似NVLink和Infini Band这样“拿来即用”的解决方案。
相较于硬件平台,英伟达在软件生态上的优势,可谓是“第二名看不到车尾灯”式的领先。
这两个因素直接导致将ASIC用于AI推理,现阶段注定只是头部CSP厂商的游戏。上述产业投资人士认为,“全世界范围内,对推理端ASIC芯片有强烈需求的云厂商,满打满算可能都不超过10家。”
更重要的一点是,对于头部CSP厂商来说,其丰富的产品矩阵注定了短时间内仍需要将更加泛用的GPU作为算力中心的核心,毕竟当新的算法或应用场景出现时,GPU可以通过软件升级来支持,而ASIC则需要重新做产品设计。
因此,短时间内以博通为代表的ASIC厂商,恐怕还无法推翻“英伟达叙事”。
国产ASIC,乘风而起?
前文提到,国内头部CSP厂商都在做自研ASIC,这其中大概可以分为两类:
第一类是以阿里和百度为代表的“纯自研路线”,与二者相关联的平头哥和昆仑芯,均已组建ASIC研发团队,并已完成相关产品的流片及量产出货。
第二类则是以字节跳动为代表的厂商,他们与第三方芯片设计公司携手研发ASIC芯片。
这两类厂商的共同点是,出于供应链安全的考量,他们对ASIC芯片的国产替代都有不同程度的需求。
这构成了国内ASIC芯片公司最坚实的基本盘,但就目前来看,国内ASIC芯片公司还有几处明显的短板需要解决。
首当其冲的就是IP核资源的稀疏。
作为对比,博通在为谷歌打造GPU时,除了提供先进封装技术、光互连技术外,还附带了一批高性能互联IP核,涵盖高速SerDes内核、PCIe接口等。如果没有这些丰富的IP核资源,谷歌TPU的研发时间会更长。
而国内AISC厂商,有时还需要先通过博通、Marvell等公司取得IP授权,这对于作为客户的CSP厂商来说,就有点得不偿失了。
另外,博通作为一家Fabless(无晶圆厂)公司,它却可以提供除代工外的全流程服务,从最前端的规格定义到最后端的3.5D先进封装,博通均可提供成熟的解决方案。
一位业内人士向笔者表示,“现在很多人把因果倒置了,不是选择ASIC路线就能推理成本骤降,而是像博通这样的企业,其强大的in-House优势让ASIC芯片的研发成本能够降低。”
还有一个无法忽视的问题是,随着BIS新规的生效,本土ASIC芯片的可代工产能被进一步收紧。当然,随着半导体行业国产替代进程的加快,这个制约因素未来有望得到改善。