2023年5月台北电脑展,英伟达创始人兼CEO黄仁勋在结束了自家产品发布和演讲后匆匆离席。再次出现时,黄仁勋已经来到联发科展台,握住了多年老友、联发科CEO蔡力行的手。
借此,英伟达、联发科两大芯片设计巨头宣布联手,“发达联盟”就此成型,面向风起云涌又前景无限的智能汽车,打造开发全新汽车芯片。
两年后,“发达联盟”在上海车展发力。4月23日,联发科发布了基于双方最顶尖技术打造的天玑汽车旗舰座舱平台C-X1。
绝大多数消费者乃至汽车行业人士,并不清楚这枚旗舰级座舱芯片背后的产业故事,但它的的确确串联起了智能汽车芯片的过去和未来。
顶峰再聚首
虽然英伟达与联发科如今打得火热,但时间倒退十余年,双方其实是在移动SoC上相互竞争的对手。
那时联发科作为第一批国产智能手机的核心供应商,其“Turn-key”方案大放异彩,在“中华酷联”的崛起中占得先机。而英伟达从显卡转战而来,为了推介自家手机芯片,黄仁勋曾为小米3发布会站台,高喊“我也是米粉”。
2014年,两家公司短暂相交的命运线慢慢错开,并在漫长的坚持与等待中,分别找到了自己新的成长曲线:
因为基带、功耗等问题难解,英伟达当年宣布将退出移动SoC市场,重心逐步转向AI芯片,最终以超前布局等来了AI的爆发,成为AI生态的首席卖铲人。
同年,联发科发布八核手机处理器MT6795,向高端移动SoC发起冲击,并在5G时代到来后愈战愈勇,出货量霸榜同时,凭借天玑9000系列在高端手机SoC市场与高通并列双雄。
双方的汽车芯片业务也因之分化:
联发科承袭移动SoC的禀赋,为全球车企车机提供座舱、通信芯片,天玑汽车座舱平台累计出货量超2000万套,成为市场上重要的参与者。
由于如今汽车座舱SoC多与移动SoC同源,在天玑9000系列成功拿下高端手机SoC市场之时,天玑汽车座舱平台也迎来了冲向高端的绝佳时机。2023年,联发科就规划好了全球首款3nm汽车座舱芯片——能一芯带多屏、运行130亿参数大模型、CPU与AI性能皆强于目前市场旗舰的MT8678。
联发科去年发布的旗舰座舱芯片MT8678
英伟达将移动SoC投向汽车座舱短暂试水后,选择All in自动驾驶,客户从特斯拉、自动驾驶创业公司拓展到国内造车新势力、传统车企,一步步成为下游研发高级辅助驾驶、自动驾驶难以绕开的选择,并在2022年发布了首款单芯算力达1000Tops的自动驾驶芯片Thor。
英伟达旗舰智驾芯片Thor
按照规划,这两枚芯片预计都会在2025年后量产装车。因为规划激进、制程先进,它们今年在性能上都是各自领域中暂无敌手的存在,也顺理成章获得了不少车企的订单。
至此,联发科、英伟达渐渐有成为智能汽车芯片遥相呼应又泾渭分明的双峰之势——前者旗舰级智能座舱芯片冲高效果显著,后者旗舰级智能驾驶芯片独孤求败。
但历史的洪流还是让两家公司再度聚首。只不过,曾经在移动SoC市场交锋的双方这一次没有对垒,而是选择了携手。
而联发科与英伟达之所以愿意合作,一方面是因为蔡力行与黄仁勋有近三十年的交情;另一方面,汽车行业两个既是机遇又充满挑战的趋势,都摆在了两位CEO面前:
生成式大模型的上车热潮,与越来越深入的舱驾融合。
强强联手
今年Deepseek R1在春节爆火后,国内不少车企连夜宣布接入R1——被强化学习淬炼过的R1足够聪明,车企寄望它让座舱中的智能助手变得真智能,从而赢得更多订单。
但无一例外地,车企都是以云端部署的方式接入R1,其响应速度、数据隐私都难以得到保证。将模型放在车端座舱芯片本地部署可以避免这些问题。然而,尽管现有座舱芯片的AI算力已经长足进步,仍与云端算力仍相去甚远,根本无力运行6710亿参数的Deepseek R1。
为了实现大模型的本地部署,业界做了大量包括蒸馏、量化在内的努力,试图缩减模型参数量。但一个既能看懂图、又能听懂话,能更好理解人类意图的多模态大模型,参数量依旧是70亿起步,数百亿为宜。
这为包括联发科在内的座舱芯片供应商提了个难题:
座舱对AI算力的要求在往小型服务器发展,芯片AI计算模块越大越好,但座舱SoC又天生需要多样化的计算单元应对不同任务。特别是制程迭代到3nm,芯片面积寸土寸金,CPU、GPU、基带等模块已占据大量空间,大肆堆叠AI计算模块要么容易顾此失彼,要么被迫扩大芯片面积导致成本失控。
而英伟达虽然有意助力生成式大模型在智能座舱的落地,为其AI卖铲生意再添一片富矿,但英伟达已退出座舱芯片市场多年,且手中缺乏基带,难以为座舱提供集成度高、能力完整的SoC方案。
面对智能座舱对算力的层层加码和既要又要,联发科与英伟达果断选择合作,将两者的优势以一种物理距离极短的方式整合到一起——Chiplet(芯粒)。
Chiplet示意图
Chiplet引入了模块化概念,它通过高带宽的先进封装技术,可将不同功能、不同制程、乃至不同厂商的多枚芯片裸片拼接在一起,克服了单芯片面积越大,良率越低、成本越高的难题,能以更低的成本达成更好的计算能力。
在联发科与英伟达的合作中,联发科C-X1就以Chiplet的形式,将英伟达最新Blackwell架构的GPU集成在内,将整枚芯片打造成了旗舰中的旗舰:
因为用上3nm制程和Arm最新的V9.2-A大核架构,C-X1的CPU单核性能据估算领先高通8295 80%,而其CPU为12核设计,足以应对6-12个屏幕的多任务计算;
由于集成英伟达的GPU,C-X1拥有10.2 TFLOPS浮点算力,支持英伟达独家的DLSS技术,渲染性能赶上主流甜品级独立显卡,意味着其不仅可以带动高清大屏的复杂动效,还能支持在车载大屏上流畅游玩3A游戏。
最重要的是,C-X1内建的NPU与英伟达的GPU组成的双AI引擎,可以总共提供400TOPS AI算力。为了最大限度地降低模型训练后部署到车上的难度、精度损失与内存开销,C-X1引入了对FP4格式量化的硬件级支持,将内存带宽的使用降低了50%。
据估算,C-X1大语言模型推理性能比竞品高350%。
而在成本端,尽管C-X1参数豪华,但运用Chiplet集成4nm制程的英伟达GPU,帮助其减少了3nm晶圆的使用面积,达成了成本1+1<2、效果1+1>2的表现。
对消费者来说,这些眼花缭乱的数字会在未来几年转化为看得见摸得着的智能座舱体验:
当芯片有能力运行数百亿参数的多模态大模型,语音助手才不会总是化身尬聊助手;DMS(驾驶员注意力监测系统)才不至于时不时误触发;座舱对用户意图的理解、对舱内外环境的感知才会更准确,个性化推荐才会更精准。
届时,一个真正达到AI Agent(智能体)水平的,能根据用户一句话(甚至一个表情)就完成一个连贯任务(而不是一戳一蹦跶)的真·智能助手,才有机会诞生在汽车座舱里。
而这只是联发科与英伟达合作的一部分。
你中有我
去年,某新势力车厂生产的新车型,将智舱芯片与智驾芯片集成到了同一块PCB板上,将整车电子电气架构从域控向中央计算推进了一步。
对新计算平台的一个典型运用,是将4枚智驾芯片Orin X共计1016T AI算力的富余部分抽调出来,运行AI算力60T的座舱芯片力有不逮的神经网络与应用。
尽管这让人们开始怀疑车厂硬件配置过度冗余的“嫌疑”,但也反映出一种技术趋势:舱驾融合,正在进入新的阶段。
传统上,汽车智舱与智驾芯片各自独立,各司其职。但随着车企试图提供越来越好的体验,汽车越来越智能,智舱与智驾之间必然产生频繁的数据交换和能力调用,此时两枚芯片贴得越近,效果越好,单位成本越低——距离上的融合有助于能力的融合,正如人类的大脑和小脑紧靠在一起。
面向这一趋势,基于对彼此的信任和能力的互补,联发科与英伟达合作,开发了“我提供智舱芯片、你提供智驾芯片“的One Board舱驾融合方案。
在硬件上,联发科的C-X1与英伟达的Thor可以被集成在一块板卡上以降低成本、提升互联互通效果。而在软件上,双方更进一步,联发科主动适配了英伟达的车载操作系统套件NVIDIA Drive OS。
C-X1支持运行NVIDIA Drive OS
C-X1和Thor都运行NVIDIA Drive OS的意义在于,智舱和智驾之间的互动将不再局限于数据交换和单向的能力调用,在同一操作系统下,两者可以实现资源池化,即硬件资源可以被抽象到一个池子中,供车上的应用自由调用。
而硬件资源尤其是AI算力的丰沛、自由流动,往往是培育更强大AI应用的土壤,车企将得以提供更丰富、更精细、具备全局智能属性的用车体验。
比如,未来的智能驾驶可以分析车内乘客是否入睡,从而决定行车模式是否应当更舒适。或者当车主在停车状态下决定在车载大屏上玩把游戏,智驾芯片的AI算力也可以被临时抽调过来,增强游戏性能。
智能汽车行业对更深程度舱驾融合的不懈追求,反映出一种朴素的智能观:智能不是两种不同能力的简单拼凑,而是在整体上对不同能力的有机调度。
这是联发科与英伟达深度合作的底层驱动因素。
在此之后,出于更高性能、更低成本的考虑,智舱芯片和智驾芯片或许会走向合二为一的终局,谁来主导看似是个问题。
但联发科与英伟达通过C-X1形成的“我在硬件上整合你,你在软件上赋能我”式合作,提供了一种非零和博弈思路:
固然,产业的进程常常被竞争与对抗塑造。但历史的草蛇灰线,同样也藏在一次次相逢一笑的分工与协作里。
参考资料
[1]8.3K Stars!《多模态大语言模型综述》重大升级,量子位
作者:熊宇翔
编辑:罗松松
责任编辑:罗松松