AGI时代下,“未来汽车”出行会是怎么样的?在2025上海车展开幕之际,记者采访了商汤科技联合创始人、首席科学家、商汤绝影CEO王晓刚。商汤绝影是专注于汽车行业领先的AI公司,旨在推动智能汽车加速驶入通用人工智能时代。王晓刚认为:原生流式多模态大模型带来人机交互体验的变革,智能汽车可以拥有“有趣的灵魂”。

问:AGI赋能下,会给智能汽车带来哪些主要变革?

答:我认为主要在三方面:第一是通过原生流式多模态大模型带来的人机交互体验的变革;第二是通过端到端智驾技术的升级,带来极致自动驾驶安全和效率;第三是舱驾融合驱动智能汽车往超级智能体方向演进,极大拓展了人与物理和数字世界的连接。

在智能汽车的应用部署上,绝影制定了端云协同的部署策略,通过意图分流来进行任务在端云两侧的协同,当前场景任务有80%是在端侧处理。端云协同的方式可覆盖广泛的场景交互,保证安全可靠、实时响应,并充分保障个人隐私安全。

问:在“舱—驾—云”三方面,现在有哪些被业界广泛认可的解决方案?

答:在智能驾驶领域,我们在2022年发布了行业首个感知决策一体化的辅助驾驶通用模型UniAD,这是和特斯拉FSD一样的一段式端到端方案,获得2023年国际计算机视觉与模式识别会议的最佳论文,引领行业的潮流。今年,我们又发布了行业首个与世界模型协同交互的端到端智驾技术方案R-UniAD,让世界模型和强化学习框架相结合,构建生成式智驾新范式,这也是今年行业都非常认可的技术方案。

面向智能座舱,我们打造了新一代座舱情感引擎New Member“家庭新成员”,能够察言观色、无时不在、与你心有灵犀,让每一辆车拥有“有趣的灵魂”,这个产品得到很多认可,已经在知名车企量产交付了。

我们还有更多的AI产品也都是创新性的,比如我们有一个全场景健康管家产品,3月份量产上车了星途揽月,是行业首个量产上车的医疗AI大模型产品。

问:大模型为智能汽车的发展带来了哪些助力?

答:绝影打造了世界模型“开悟”——它可以理解真实世界中的“物理法则”和“交通规则”,并在此基础上,能够生成“准确”的场景。“开悟”生产数据的效率很高,生成的场景是可控的,能细微到“元素级别”,生成场景非常精细,完全满足端到端模型训练和仿真对于数据质量的高要求。

上海车展上,“开悟”世界模型也升级到了2.0版本,结合强化学习框架,能够实现端到端算法和世界模型的协同交互,打破数据瓶颈,让辅助驾驶的安全更有确定性。

New Member“家庭新成员”背后则离不开多模态大模型的支持,绝影的原生流式多模态大模型让世间万物都可被感知、被理解、被交互。我们在端侧部署了商汤的日日新V6多模态大模型,New Member能够做到多模态识人,汽车不仅能够认识你,还可以理解你,不再是被动响应,而是成为一个懂你、会揣摩你心思的“聪明搭子”,能够真正参与座舱内的多人多轮对话,既不过度打扰,又能时刻陪伴。

原标题:《新民·科技前沿③|商汤绝影王晓刚:智能汽车可以拥有“有趣的灵魂”》

栏目编辑:王蔚 文字编辑:马丹

来源:作者:新民晚报 郜阳

ad1 webp
ad2 webp
ad1 webp
ad2 webp