以城市NOA为标志的高阶智驾喊了两年,今年终于迎来了业界公认的“拐点”。
所谓“拐点”,到底意味着什么呢?笔者从多位业界大佬口中,得到了不尽相同的答案,其中一些观点,为我们提供了深度观察自动驾驶的新视角。
1、从“人在开车在看”,到“车在开人在看”
在日前举办的媒体沟通会上,地平线创始人兼CEO余凯博士表示,前几年大家嘴上喊着“拐了拐了”,实际上是在找“卖点”,心里想的其实是“赶紧卖了卖了”。但如今,自动驾驶真的要“拐了”。
他认为,“拐”的一大体现,是促成智驾普及的技术三要素终于集齐了。第一是领先的算法,随着多模态大模型,包括端到端、VLA等新算法框架的落地应用,智能驾驶开始真正具备类人的智能,而不是纯靠规则执行的程序。最直接的体现便是,“开城”在2025年不是难事,不管开到哪个城市都能“开成”。第二大要素是足够大的算力,第三则是海量丰富的数据。
基于三大技术要素,智能驾驶跨过了“人在开车在看”的门槛,能够在复杂道路实现“车在开人在看”。目前,华为乾崑智驾ADS 3(参数丨图片).2已经能做到车位到车位自动驾驶和泊车代驾,今年将迭代到ADS 4版本,达到L3水平;理想和小鹏分别于去年四季度和今年1月推送了全程无断点的车位到车位智驾功能;即将于今年Q3量产上车的地平线Horizon SuperDrive全场景智能驾驶解决方案,则具备了融合倒车能力和支持漫游模式的城市NOA,后续结合智能泊车功能,也可实现“点到点”自动驾驶。
余凯预言,智驾将在3年内实现“脱手开”,用户可以放开双手让汽车自己行驶,仅需处理突发情况;5年达到“闭眼开”,用户不必时刻关注路况,更智能、更安全;10年“随心开”,用户可以完全不用开车,实现完全的自动驾驶。
技术和能力上的“拐点”,将为智驾系统的装车量带来全新的增长曲率。华为智能汽车解决方案BU CEO靳玉志不久前指出,目前20万以上的新能源车L2+(高速NOA功能)装配率已达65%。2024年华为年度智驾活跃用户数已超50万,智驾里程占比约为30%,其中年度城区智驾时长占45.2%。靳玉志预计,2024~2028年将有2000万辆新能源车搭载城市NOA高阶智驾功能。
2、跳出营销语境,技术大牛务实且悲观
在企业的宣传话术中,“拐点”之后,就是全民智驾时代——下一代数智汽车与传统汽车的分水岭由此显现,并且二者之间的差距会越来越大。而自家企业已经跻身智驾“第一梯队”,“超越特斯拉,全球都能开”。
余凯放言,“自动驾驶基本上三年搞定,未来已来,我认为到三年以后每个人都会爱用自动驾驶,地平线有这个判断,有这个决心。”
余承东最近也在微博里发布了多条享界S9的“用车感受”,点赞智驾功能:“每天上下班都是华为智驾在开,无需司机了呵!”
然而,老总们其实都是销售,就像余凯所说,“为了卖货,不要说Chief Experience Officer,你让我当Chief Entertainment Officer都可以”。跳出营销语境,在真正上手干活的研发人员眼中,智驾的“拐点”却换了另外一种画风。
科技大咖们往往会从人工智能的角度看待智能驾驶,像地平线副总裁兼首席架构师苏箐,从事了十多年AI和自动驾驶的研发工作,曾多次领导开发中国智能手机和汽车的先进处理硬件和架构。他认为,智驾的拐点只有一个,是不是比人开得好。“比不过人的时候,智驾就是高科技的玩具,有一天比人好了,智驾价值就会立刻跃升上去”。
按照苏箐的观点,自动驾驶对标的对象,不是特斯拉、华为、理想、小鹏等业内友商,而是人。此前,笔者在与长安汽车首席智能驾驶技术官陶吉交流时,他也曾表示,自己事业的终极目标是做具身机器人,但在此之前,数智汽车是AI落地应用并实现产业化的重要一步。因为长安的领导层认同并支持他的想法,这位百度智驾的“元老”加入了长安。
陶吉告诉笔者,长安的智驾目标首先是要像老司机,用户感觉就像坐在出租车里一样,可以放心让它开;最终目标则是成为用户个人的专属司机和助理,智驾会按照你喜欢的驾驶模式开车。
智驾要类人,超越人,说来简单,实际却非常困难。一家智驾企业的内部人员对笔者说,营销只解释了一部分what和why的问题,而工程团队面对的则是how的问题。“智驾开发人员的一天非常简单,睁开眼看到的是一堆具体的问题,1、2、3、4逐一解决它。我们不会想太多。”
苏箐更是直言,自己没有余凯那么乐观,甚至干到现在都快抑郁了。虽然苏箐加入地平线后,用了不到一年就带领团队打造出了可以hold住上海淮海路复杂路况的Horizon SuperDrive,但他仍然表示,到目前为止还没有一个智驾系统,真正达到了他所说的拐点,“我们只是看到了希望”。
3、“你知道,让一群聪明人一直在正确的道路笨笨的努力有多难吗?”
这些年,普通消费者感知到的,是智驾功能的飞速发展。这个月的体验和上个月相比,可能都有显著提升。而且随着算力的增长和数据的积累,端到端智驾系统的迭代速度还会越来越快。公开信息显示,特斯拉自动驾驶的更新频率大概是每5~10天一次;小鹏号称实现了每2天一次版本迭代,每2周一次体验升级。
而身在行业的人,感受到的除了技术的日新月异,还有技术变革带来的一次次认知颠覆和重建,永远有学不完的新东西,永远有更多的不确定。
两年前,BEV+Transformer还是很牛的技术,去年就被“端到端大模型”取代,今年还要再加上“一段式”、多模态大模型等定语,好像才能证明自己的技术先进性。就在一周前,笔者还认为端到端算法、大算力和海量数据是决胜智驾终局的三大利器。现在和多位技术专家聊完,发现事情远没有这么简单。
“当智驾技术驶入发展的深水区,没有哪个单一技术指标能与智驾系统的实际能力完全挂钩。”上文那位内部人员表示。
像陶吉和苏箐这样的技术大咖,早已对层出不穷的“时髦术语”无感了。在陶吉看来,智驾技术本身没有高级和不高级的区分,任何技术都须兼顾效率、成本、安全和体验,才具备商业化的可能,落不了地的技术,只能是纸上谈兵。
“智驾这种复杂系统没有‘银子弹’,也没有什么一招制敌的方法,不可能哪个聪明人搞了一个东西,智驾就搞定了。”苏箐说,“打造复杂系统的方法就是你要有一个很强大的工程团队,把系统和底座做得非常坚实。”他认为在智驾领域,特斯拉依旧“遥遥领先”,其最强之处,正是工程能力。
何为工程能力?简单说,就是快速吸收新知识,把论文转化为可量产的技术和产品的能力。但这一过程充满艰辛和痛苦。
一个前沿技术,在实验室的可控条件下,往往天衣无缝,可一旦应用于现实,问题就会呈指数级增加。更可怕的是,每项技术都有自己能力的边界,即便是当前已成为主流的端到端技术范式,也只是发展高阶智驾的必经之路,并不是最终解——业界已经看到了端到端的技术局限性。
有位技术人员将开发智驾的过程,比作不断掉坑和爬坑的过程,像是宿命的轮回:你千辛万苦找到了一个方法能够解决现有问题,觉得它很美好;当你将它应用到更多场景时,新的问题就出现,你开始质疑这项技术;最终你会发现靠这项技术只能走到这里了,不得不继续寻找新的解决方案,之前的许多努力很可能都白费了。
据笔者了解,智驾技术内核的演进到今天至少是第6代了,这意味着研发人员至少经历了五次重大的“掉坑爬坑”过程。
“你知道,让一群聪明人一直在正确的道路上笨笨的努力有多难吗?”笔者没想到,这位技术人员会提出一个触及人性的哲学问题。
不难想象,聪明人完全有能力找到“捷径”。比如,用更多数据和规则兜底,尽量将用户的高频使用场景做好,忽略长尾问题。这些“捷径”的短期效果不差,虽然后续一定会“撞墙”,但和反复的“自我否定”相比,人更容易选择放过自己。
做智驾,“你要比别人有更多的经验,要比别人愿意吃更多的苦,你要持之以恒每天面对这么多问题还不崩溃,一年又一年的运作”,苏箐如是说。无奈竞争残酷,你只有5分钟的时间——用户上车5分钟,智驾功能能否让他感到惊喜,愿意信赖并持续使用,直接决定他是否会买单。
现在,笔者开始明白,为什么苏箐会“抑郁”,余凯要读佛经了,也有点理解为何这些技术大牛呈现给外人的,总是一副自命不凡却苦大仇深的模样。
本文仅为作者个人观点,不代表水滴汽车立场。