在过去的一个月中,“DeepSeek”当之无愧成为了国民话题。其以极低成本实现了与OpenAI等巨头相媲美的性能,打破硅谷“烧钱堆算力”的AI叙事规则。

与此同时,DeepSeek也成为了车圈新贵。根据亿欧汽车此前统计,截止至2月13日,共有14家车企宣布在智能座舱领域或AI运营领域完成了与DeepSeek的深度融合。


“无论从系统还是算法层面,DeepSeek都给现在的人工智能大模型指明全新方向,所以关注度特别高。”商汤绝影CEO王晓刚告诉亿欧汽车,“但据我们了解,目前各家车厂接入的DeepSeek仍处于相对简单的应用阶段。”

在王晓刚看来,目前DeepSeek的访问量增长迅猛,但其在反馈速度上出现了延迟,导致用户体验欠佳。此外,DeepSeek目前接入的模型只是原始版本,尚未与汽车产品体验进行深度结合,这在一定程度上限制了其在汽车领域的应用效果。

“DeepSeek的出现,其实给商汤绝影带来比较大的机会。”王晓刚这样判断道。

在刚刚过去的2025GDC 全球开发者先锋大会上,商汤绝影发布了“与世界模型协同交互的端到端自动驾驶路线R-UniAD”,通过构建世界模型生成在线交互的仿真环境,以此进行端到端模型的强化学习训练。据悉,该自动驾驶方案的实车部署将会亮相今年上海车展。

“这与DeepSeek技术创新思路同归一源:从模仿学习向强化学习升级演进,从而实现端到端自动驾驶超越人类的驾驶表现。”王晓刚说道。

端到端的自动驾驶本质是通过海量的高质量人类驾驶数据,来实现最佳的“老司机”驾驶效果。然而,在过去受制于高质量场景数据的稀缺性和驾驶数据质量的参差不齐,端到端自动驾驶方案在中国发展并不算一帆风顺。

特斯拉通过七百万辆高阶智驾量产车和超10万P算力,基本跨越了端到端所需的门槛,将中国车企和智驾厂商甩在后面。但是DeepSeek的出现,给中国发展端到端自动驾驶提供新思路。

DeepSeek-R1通过少量高质量数据的冷启动,模型进行多阶段的强化学习训练,有效降低大模型训练的数据规模门槛,同时也让尺度定律得以延续,为模型变得更大更强铺平了道路。更重要的是,强化学习能够让大模型自行涌现出长思维链能力,显著提升推理效果,甚至可能具备超越人类的思维能力。

“基于强化学习的大模型技术路线可以迁移到端到端自动驾驶算法的训练和研发之中。”王晓刚如此表示。

商汤绝影此次发布的R-UniAD就是“多阶段强化学习”端到端自动驾驶技术路线,具体分为三个阶段,首先是依靠冷启动数据通过模仿学习进行云端的端到端自动驾驶大模型训练;然后基于强化学习,让云端的端到端大模型与世界模型协同交互,持续提升端到端模型的性能;最后云端大模型通过高效蒸馏的方式,实现高性能端到端自动驾驶小模型的车端部署。


在商汤绝影看来,端到端智驾模型是一个多模态具身模型,最关键的是要与依靠世界模型生成的仿真环境进行在线交互,并获得闭环奖励反馈,从而实现强化学习,使得端到端模型的训练能够充分探索各种可能性。也就是说,能够生成高保真的场景数据、保证长时推演一致性、并支持在线交互的强大世界模型是R-UniAD的核心基石。

“智驾高端局的竞争不止是车端模型的比拼,端到端的决战,战场在云端。”在2024年11月“绝影实力AI DAY”上,王晓刚就如此说道。

在该认知下,商汤绝影彼时就发布“开悟”世界模型。基于该模型,1个GPU产生的仿真数据相当于500台量产车的数据采集效果。据官方介绍,随着“开悟”世界模型能力的进一步提升,将支持实现端到端算法与世界模型仿真环境实时交互。

在现场演示中,商汤绝影展示了“开悟”世界模型与主车闭环交互的方式。通过场景库文件导入一个BEV视角下的初始主车和他车位置,世界模型自动生成主车视角下11V(11个摄像头)的传感器仿真数据,端到端模型接收到这一数据后,生成自车下一时刻位置并进行反馈,世界模型根据刷新的主车位置和预测的他车位置渲染新的11V传感器仿真数据。

商汤绝影的量产端到端智驾方案预计将在年底交付,“开悟”世界模型也正式用于数据生产。而在4月的上海车展,商汤绝影将会展示R-UniAD这个“智驾版DeepSeek”的实车部署。

ad1 webp
ad2 webp
ad1 webp
ad2 webp