前段时间,原名大疆车载的卓驭科技推送了32T和100T算力的端到端智驾方案。

一些看热闹不嫌事大的吃瓜群众借此暗讽蔚小理,是不是因为水平太低,以至于需要508T或1016T算力才能实现卓驭科技仅需32T算力就能实现的城区NOA?

这事儿,显然不能这么理解!

摆事实讲道理、根据数据进行定量分析和对比是一名科技工作者的基本素质。

在这里,首先需要澄清的是,在卓驭科技的成行平台里,32T版本可以实现高速巡航和城区记忆领航,无法实现城区NOA,只有100T版本才可以实现城区NOA。

认为32T算力就能实现城区NOA的吃瓜群众们应该尊重一下“常识”。


在卓驭科技的100TOPS算力域控制器+10V方案量产之前,除了华为和特斯拉这俩“真全栈自研”的异类,实现了量产上车的高阶城区智驾方案均采用了英伟达的Drive Orin X计算平台。

智驾方案供应商这边,元戎启行的方案系统配置为1颗Orin X+1颗激光雷达,Momenta的方案使用了1颗Orin X+1-2颗激光雷达。

车企这边,理想汽车AD Max使用2颗Orin X+1颗激光雷达,蔚来NOP+使用4颗Orin X+1颗激光雷达,小鹏XNGP使用了2颗Orin X,Max方案包括1颗激光雷达,鹰眼视觉方案不带激光雷达。


这么横向对比下来,卓驭科技的100T方案不仅没有使用激光雷达,即便和配置最精简、使用了1颗Orin X的乐道视觉智驾方案相比,100T的算力也足够低,确实把成本压榨到了极致。

据悉,成行平台32T方案的计算平台来自德州仪器,使用了TI的TDA4 VH芯片,100T方案的计算平台来自高通,使用了Ride 8650。


业界对TI的TDA4非常熟悉,这颗芯片被广泛应用在可实现高速NOA的中阶智驾方案中,在NOA计算平台中的市场占有率甚至超过了Mobileye。

高通Ride 8650的上车时间较晚,但也得到了丰田、大众、比亚迪这些注重成本的绝对头部车企的青睐。


配置对比就到这里,接下来,问题来了,卓驭科技的算力是如此之低,它是怎么实现号称全国都能开的城区NOA的呢?

网上有那么一句话,哪里有什么岁月静好,不过是有人在帮你负重前行!

其实,卓驭科技成行平台之所以能够做到低算力,主要的原因是把需要车端计算芯片干的一些活甩到了云端,有云端替车端负重前行而已。

在不明真相的群众眼里,卓驭科技之所以可以在100T的算力上实现城区NOA,主要得益于其智驾团队具备极致压榨硬件算力的能力。

这种说法听听就可以了,谁也没有三头六臂,谁也不比谁少胳膊少腿,有一说一,国内头部的自动驾驶团队哪一个是没有两把刷子的?


还是要客观地回到计算任务的分割和外包上来。自动驾驶系统要完成的计算任务是准确地感知自车周围环境,结合安全、舒适、高效三大指标,根据感知结果规划可行的行驶路径。

其中,感知占据了大部分计算负荷,在感知任务里,智驾系统主要实现道路拓扑的推理和交通参与者的检测,和千变万化的交通参与者只能依靠端侧实时检测相比,道路拓扑的推理可以通过端侧感知+地图外挂的方式实现。


这就是被大家广泛讨论的轻地图方案,车端检测一部分道路语义要素,云端地图提供一部分道路语义要素,端云协同,两相结合,共同推理出完整的道路拓扑。


出于营销的原因,大部分车企都对地图二字避之唯恐不及。但是,卓驭科技之前在方案介绍中大大方方、明明白白地表明采用了“定制标清地图”,现在的官方口径是使用了“自动驾驶地图”AD Map。


即便把道路拓扑检测的部分任务卸载到了云端,成行平台的100T算力还是低得不可思议,卓驭科技能把算力压到这么低,应该还有其它秘密武器。

前段时间,中国巴菲特段永平先生在其母校浙江大学接受了在校师生的采访。

在访谈中,大道参数图片)无形我有型表示,一个人最重要的不是是否勤奋,而是能不能看到事物的本质。

说到城区智驾方案能力的本质,可以密集性、细粒度地检测空间体素深度信息的占用网络是必不可少的要素之一。


占用网络的价值无需过多阐述,概要来讲,和传统的3D目标检测算法相比,占用网络可以对每个体素进行语义标签的预测,生成密集预测的环境表示,使环境感知更可靠、更稳定,解决了不在白名单范围之内的通用障碍物的识别问题。


占用网络必不可少,实现方式却也灵活。如果使用激光雷达,可以融合摄像头的视觉信息和激光雷达的点云信息实现占用网络,华为ADS中的GOD网络就大量使用了激光雷达的信息。

按照华为的说法,这种方式可以降低对训练数据规模的要求,也能降低车端视觉神经网络的规模。


如果是纯视觉方案,且不说视觉占用网络的云端训练需要消耗大量算力和数据,其车端运行同样会需要消耗大量的算力。

为了能够从不具备深度信息的二维图片中估计出空间体素的深度信息,特斯拉FSD占用网络的参数规模达到了亿级。

在2022年的AI Day上,特斯拉曾经透露过FSD神经网络的参数规模为10亿左右,从这张流水线热图可以看出,占用网络的参数应该过亿!


要在100T的算力上实现占用网络,卓驭科技祭出了秘密武器-AI双目技术。

简单来说,通过精确布置的双目摄像头对同一场景进行成像,利用双目摄像头的内参、外参、视差,就可以计算出每个像素点对应的物体的深度信息。

类似于激光雷达方案,双目立体视觉相当于通过传感器的升维实现了算法复杂度的降维。


一方面,卓驭科技通过介于高精地图和导航地图之间的定制标清地图辅助车端感知,降低了对车端感知能力和算力的需求。

另一方面,它通过可方便计算深度信息的双目摄像头简化了占用网络的设计,进一步降低了对车端算力的需求。

算力的背后都是实打实的金钱,在此做一个可能靠谱也可能不靠谱的判断,卓驭科技的这套方案会格外受到注重成本和利润的车企们的喜欢。

ad1 webp
ad2 webp
ad1 webp
ad2 webp