AGI时代下,未来汽车出行会是怎么样的?在2025上海车展开幕之际,新民晚报记者采访了商汤科技联合创始人、首席科学家、商汤绝影CEO王晓刚。商汤绝影是最专注于汽车行业领先的AI公司,旨在推动智能汽车加速驶入通用人工智能时代。

在他看来,“未来汽车”要实现更为自然的、有温度的人车交互体验,让智能汽车从出行代步工具,进化为有情感的家庭新成员;同时它还能结合世界模型,持续提升辅助驾驶的性能,让驾驶安全更有确定性。


商汤科技联合创始人、首席科学家、商汤绝影CEO王晓刚

新民晚报:AGI赋能下,会给智能汽车带来哪些主要变革?

王晓刚:我认为主要在三方面:第一是通过原生流式多模态大模型带来的人机交互体验的变革;第二是通过端到端智驾技术的升级,带来极致自动驾驶安全和效率;第三是舱驾融合驱动智能汽车往超级智能体方向演进,极大拓展了人与物理和数字世界的连接。

在智能汽车的应用部署上,绝影制定了端云协同的部署策略,通过意图分流来进行任务在端云两侧的协同,当前场景任务有80%是在端侧处理。端云协同的方式可覆盖广泛的场景交互,保证安全可靠、实时响应,并充分保障个人隐私安全。

新民晚报:在“舱—驾—云”三方面,绝影提供了哪些被业界广泛认可的解决方案?

王晓刚:在智能驾驶领域,我们在2022年发布了行业首个感知决策一体化的辅助驾驶通用模型UniAD,这是和特斯拉FSD一样的一段式端到端方案,获得2023年国际计算机视觉与模式识别会议的最佳论文,引领行业的潮流。今年,我们又发布了行业首个与世界模型协同交互的端到端智驾技术方案R-UniAD,让世界模型和强化学习框架相结合,构建生成式智驾新范式,这也是今年行业都非常认可的技术方案。

面向智能座舱,我们打造了新一代座舱情感引擎New Member“家庭新成员”,能够察言观色、无时不在、与你心有灵犀,让每一辆车拥有“有趣的灵魂”,这个产品得到很多认可,不少车企也在之后发布了类似的概念,这款产品已经在知名车企量产交付了,今年车展我们也进一步升级,发布行业首个专为车载AIOS打造的AI内核“绝影千机”,助力New Member实现突破性技术升级。


我们还有更多的AI产品也都是创新性的,比如我们有一个全场景健康管家产品,3月份量产上车了星途揽月,是行业首个量产上车的医疗AI大模型产品。

新民晚报:现在是大模型的时代,大模型为智能汽车的发展带来了哪些助力?

王晓刚:绝影打造了世界模型“开悟”——它可以理解真实世界中的“物理法则”和“交通规则”,并在此基础上,能够生成“准确”的场景。具体来说,生成的视频是11V时空一致的,时间最长可以达到150秒,分辨率能够达到1080P;同时,“开悟”生成的场景也是可控的,能细微到“元素级别”,生成场景非常精细,完全满足端到端模型训练和仿真对于数据质量的高要求。

“开悟”生产数据的效率很高。对比行业平均水平,我们进行过测算,基于1张 A100 GPU,“开悟”世界模型平均每天的数据生成量,相当于100台路测车的数据采集能力,比得上500台量产车的效率。


世界模型“开悟”

上海车展上面,“开悟”世界模型也升级到了2.0版本,结合强化学习框架,能够实现端到端算法和世界模型的协同交互,打破数据瓶颈,让辅助驾驶的安全更有确定性。

New Member(家庭新成员)背后则离不开多模态大模型的支持,绝影的原生流式多模态大模型让世间万物都可被感知、被理解、被交互。商汤最近发布了日日新V6多模态大模型,我们也实现了端侧部署,New Member也有突破性的技术升级,能够做到多模态识人,汽车不仅能够认识你,还可以理解你,不再是被动响应,而是成为一个懂你、会揣摩你心思的“聪明搭子”,能够真正参与到座舱内的多人多轮对话当中,既不过度打扰,但又能时刻陪伴。

我们的New Member是通过集成了大语言模型、多模态大模型还有记忆框架等AI能力,才能实现察言观色、无时不在、与你心有灵犀的交互,让每一辆车拥有“有趣的灵魂”。

原标题:《新民·科技前沿|商汤绝影CEO王晓刚:智能汽车如何驶向AGI时代》

栏目编辑:马丹 图片来源:采访对象供图

来源:作者:新民晚报 郜阳

ad1 webp
ad2 webp
ad1 webp
ad2 webp