小鹏汽车
小鹏汽车的智能驾驶系统(XPILOT)硬件架构非常先进,最新的G9车型搭载了双Nvidia Orin芯片,总算力达508 TOPS,并配备了12个摄像头、5个毫米波雷达、12个超声波雷达以及2颗激光雷达。其中两颗激光雷达作为视觉感知的补盲传感器使用,而非唯一依赖;高分辨率的摄像头使其能够远距离识别场景。
在软件方面,小鹏采用模块化的感知体系并结合端到端的规划网络。XPILOT多年来通过不断迭代积累了大量路测数据,逐步优化感知、地图和决策模块(可以看作“模块化端到端”风格)。小鹏特别强调基于高精地图的NGP(导航引导驾驶)能力。
经过多年的迭代,小鹏已经在高速和城市场景下逐步实现点对点辅助驾驶功能,如在P5等车型测试中,其城市NGP功能的每百公里接管次数已接近高速NGP水平,表明这一技术正在实用化推进。
此外,小鹏G9基于最新的X-EEA 3.0电子电气架构,采用千兆以太网作为通信主干,以支持自动驾驶、智能座舱和OTA升级等功能。总体来看,小鹏的特点是重硬件投入(多模态传感融合、高算力平台)和快速迭代的算法升级,目标在开放道路上实现更多城市驾驶场景的自动化。
理想汽车
理想汽车的智能驾驶技术近年来也有重大突破。其新车型L9首次实现了对外宣称的高速自动驾驶,其硬件配置与小鹏G9相当,搭载双Orin-X芯片(总算力508 TOPS)和禾赛128线激光雷达。
软件架构方面,理想采用了“快慢双系统”策略,使用端到端网络负责低延迟的实时控制(快系统),同时引入视觉语言大模型增强对复杂场景的理解(慢系统)。理想过去一年通过在端到端模型之外叠加VLM,利用大模型来解析语义信息(例如交通标志含义、行人行为推理等),以辅助端到端模型进行决策。该方案在现实计算资源下仍占用了整颗Orin-X算力,双模型的协同效率有待提升。
据报道,理想计划在2025年下半年推出下一代VLA(视觉-语言-动作)端到端大模型,将视觉和语言能力深度耦合,进一步提升模型的多模态推理能力,并有望显著降低人工接管率。理想的应用场景主要以家庭高速游览为主,也在测试城市道路自动辅助驾驶,其特点是注重安全性(大量冗余传感和算力备份)以及逐步向大模型方向发展。
特斯拉
特斯拉作为自动驾驶领域的先锋,目前已几乎完全采用纯视觉架构。其最新硬件(HW4)集成了8个环视摄像头,加上一些毫米波雷达单元(2021年后曾去除,后又部分恢复)以及两个自研FSD芯片,总算力级别也在数百TOPS量级。与前两者不同,特斯拉并不使用激光雷达和高精地图,其规划系统完全依赖基于深度学习的视觉和雷达感知结果。
2023年特斯拉公开的资料显示,其最新FSD 版本采用了端到端的BEV占据网络进行路径规划。该网络从多摄像头拼接出的BEV语义图中直接预测可行驶空间,从而生成车辆轨迹。这种规划方法弱化了对事先道路拓扑的依赖,通过数据驱动的方式学习环境语义,有助于多传感器信息的融合。
特斯拉的应用场景从美国高速公路一路扩展到全球城市街道,其FSD Beta在有限条件下可完成复杂路口及高速匝道等任务。总体而言,特斯拉的特点是End-to-End First,系统设计简化为几层网络联合优化,以大量实车数据驱动模型迭代,不断通过OTA推送来改进驾驶策略,其决策机制完全由神经网络学习实现,黑箱化程度较高。