AI技术、驾驶辅助快速发展,但相关争议从未停歇。因辅助驾驶引发的事故频发,多家车企的辅助驾驶功能被质疑“华而不实”,消费者对智能驾驶的信任度始终摇摆不定。在这样的背景下,理想汽车却选择了一条“死磕智能化”的道路——All in“VLA司机大模型”,试图将AI从辅助工具升级为真正的“生产工具”,让AI辅助驾驶完成从动物到“人类”的进化。

那么理想汽车这一举动究竟是“头硬”,还是预示着真正的AI智能驾驶黎明即将到来?5月7日,“理想AI Talk“第二季开播,理想汽车掌门人李想,就向全网分享了其个人以及理想汽车对人工智能的最新思考、VLA司机大模型的作用、训练方法和挑战,以及对于创业和个人成长的见解。




争议中的驾驶辅助:技术瓶颈与用户疑虑

按照行业共识,智能驾驶技术主要分为L2级辅助驾驶和更高级别的自动驾驶。尽管L2级功能(如自适应巡航、车道保持)已逐渐普及,但其局限性也十分明显:依赖高精地图、规则算法僵硬、复杂场景下仍需人工干预。更高级别的智能驾驶则因技术不成熟、法规滞后等问题,始终难以大规模落地。此外,频发的安全事故和“黑盒”问题(即AI决策过程不透明)进一步加剧了用户对智能驾驶的担忧。

面对这些争议,许多车企选择保守策略,专注于优化现有功能。但理想汽车却反其道而行之,提出了VLA司机大模型的概念,试图通过模拟人类司机的学习过程,打造一个能够独立完成驾驶任务的“AI司机”。这一大胆的尝试,无疑将理想汽车推向了行业的风口浪尖。




VLA司机大模型:从“昆虫”到“人类”的进化

理想汽车董事长兼CEO李想将AI的发展分为三个阶段:规则算法的“昆虫动物智能”、端到端模型的“哺乳动物智能”,以及VLA司机大模型的“人类智能”。他认为,只有AI成为真正的“生产工具”,才能实现技术爆发的临界点。

其实VLA,就是Vision、Language、Action的首字母缩写,翻译过来就是视觉、语言、行动,VLA大模型,就是要模拟人类司机驾驶的方式。所以VLA司机大模型的训练过程,也就模拟了人类学习驾驶的路径,即预训练、后训练和强化训练三个阶段。

其中预训练,就是通过海量视觉和语言数据,让AI掌握物理世界和交通常识;后训练则会加入动作数据,使AI具备实际驾驶能力;而强化训练,是通过人类反馈和世界模型仿真,确保AI的安全性、舒适性和职业性。

这种分阶段、渐进式的训练方法,不仅解决了传统端到端模型的“黑盒”问题,还通过“超级对齐”技术约束AI的行为,避免其学习不良驾驶习惯(如加塞)。此外,用户可以通过自然语言与VLA司机Agent交互,使其更贴近人类司机的服务体验。




是“头硬”还是“迎接黎明”?

理想汽车选择在智能驾驶争议最大的时刻加码VLA司机大模型,看似冒险,实则有其深层逻辑。对此,李想也针对用户需求、企业动向和行业发展方面进行了深刻的剖析。

简言之就是随着智能驾驶普及,用户对“真正解放双手”的需求日益强烈,VLA的“生产工具”属性恰好契合这一趋势;理想汽车自研了从芯片到操作系统的全栈技术,解决了行业普遍面临的算力瓶颈和开发效率问题;当前智能驾驶陷入“辅助工具”的瓶颈,VLA的“人类智能”定位可能成为打破僵局的关键。

然而,挑战依然存在。AI的伦理问题、法规限制、用户接受度以及技术落地的成本,都是理想汽车必须面对的“硬骨头”。但李想的态度十分明确:“创业路上苦多于甜,但没必要苦哈哈的。”他将挑战视为成长的机会,并坚信当前关于智能驾驶的争议只是黎明前的黑暗,打好扎实的基本功,打消走捷径的念头一步一个脚印地走下去,曙光终会照进现实。




结语:争议中的曙光

理想汽车的VLA司机大模型,或许是一场豪赌。但在智能驾驶的争议声中,或许也只有这种“头硬”的精神,才有可能推动行业跨越技术鸿沟,迎来真正的黎明。正如李想所说:“在AI面前,所有的人性都应被保留,因为这才是人类真正的生命力所在。”

无论结果如何,理想汽车的尝试至少为行业提供了一个新的方向:智能驾驶、AI汽车的未来,或许不在于“替代人类”,而在于“成为人类”。

ad1 webp
ad2 webp
ad1 webp
ad2 webp