旷视科技联合创始人、千里科技董事长印奇
随着印奇转换新身份,“AI+车”将成为他带领千里科技的新战略。
钛媒体AGI 3月3日消息,今晚举行的吉利AI智能科技发布会上,千里科技董事长印奇发表了主题为《从“车+AI”到“AI+车”》的演讲。
印奇表示,随着AI技术与汽车产业的共振,我们正处于从“车+AI”到“AI+车”的历史转折点。今年将会开启“AI+车”的元年,而AI与车的深度融合,将决定产业未来十年的发展格局。
印奇认为,大模型对于车端的赋能,还有很大的想象空间。他介绍说,如果将行业目前主流的智驾大模型,与最前沿的基座大模型作个简单的对比,我们会发现两者之间在算力、算法和数据的消耗,有两个甚至三个数量级的提升。真正的AI大模型,比现在车上的智能化的模型要先进一到两代。这代表我们在“AI+车”领域里面才刚刚开始,有巨大的潜力和空间。未来,我们将会在汽车上看到Scaling Law,见证ChatGPT时刻。
在他看来,未来的车将越来越趋于机器人,也是最大规模的机器人落地场景。“未来,车不仅仅是智驾,更是我们第一个真正意义上拥有最强大脑的机器人载体,”印奇表示。
这是“AI四小龙”旷视科技联合创始人印奇首次以“千里科技董事长”新身份公开发表演讲。
在此之前,2月18日,力帆科技正式更名为千里科技(SH:601777,前称为力帆股份),全新品牌将聚焦“AI+车”的核心战略,增进自动驾驶、智能座舱等领域的研发实力。而印奇是千里科技的股东、公司董事长,吉利产投也是千里科技股东之一。2月21日,印奇首次出现在阶跃星辰首届Step UP生态开放日上进行圆桌讨论。
如今在此次吉利活动上,印奇宣布,基于千里科技和吉利汽车集团的深度技术合作,将推出全新的”AI+智驾“品牌——千里浩瀚,并且在今年,业界首个具备量产能力的L3级别智驾解决方案“千里浩瀚”将覆盖吉利全系不同价位车型,吉利银河未来的全新产品都将搭载千里浩瀚,吉利中国星也将陆续搭载千里浩瀚,实现高阶智驾的普及。
作为吉利AI科技生态的一员,千里科技正在与吉利展开深度合作,研发行业领先的智驾和智舱解决方案。
印奇表示,目前千里科技聚焦“AI+车”的战略方向,快速介入到智能汽车领域,持续加大在智驾、智舱领域的业务布局。未来,超自然人机交互的诞生、自动驾驶及自动执行全面落地、车联网大模型量级升维三大前沿性技术突破有望真正打开“AI+车”的想象空间,塑造全新的智能汽车产品与体验。
印奇强调,“AI+车”时代催生了一道新的行业命题,未来需要一家能将大模型技术、产品场景定义和软硬协同能力进行系统性整合的解决方案提供商。我相信,在吉利AI科技生态的深度融合下,‘AI+车’的时代将会加速来临。”
以下是印奇演讲全文:
大家好,我是印奇。
非常高兴作为吉利AI科技生态的一员,在吉利AI智能科技发布会上跟大家分享。我今天分享的主题是《从“车+AI”到“AI+车”》。
回顾我们这个时代最大的两次技术革命,一次是新能源的技术革命,另一次就是AI的技术革命。如果我们往回看二十年,我们会发现这两条线会有一个各自发展、不断交织、深度融合的状态。我想给大家放大三个重要的历史时间点。
- 第一个节点是在2017年左右,以Transformer为代表的这样一个全新的AI技术架构推出,而仅仅一年之后,我们就看到 Waymo推出了Robotaxi的第一个商用服务,接着特斯拉FSD的Beta版本真正上线了,车和AI发生了很神奇的第一次交集。
- 第二个节点是在2021年。就在这一年,吉利发布了“智能吉利2025战略”,打造了“一网三体系”。之后不久,OpenAI发布了InstructGPT,也就是ChatGPT的前身。2023年,特斯拉发布FSD V12,首次实现纯视觉端到端智驾架构。车和AI的结合发生了一次质变。
- 第三个节点就是2025年。我想大家今年春节都过着一个非常AI的春节,我们被DeepSeek 刷屏,我们会惊叹AI 的发展让我们的生活发生如此大的变化。而紧随其后,吉利就和我们共同的生态合作伙伴阶跃星辰联合开源了两款多模态大模型,是全球最领先的开源多模态大模型。今年,也是”智能吉利2025战略“的收官之年。大家会看到吉利联合AI生态,发布更多业内领先的智驾和智舱产品。随着这一系列的突破,我们可以说,2025年,不仅仅是车+AI,而是AI+车正式来到了元年。
当我们提到AI的时候,我们想到的最多的一个词就是模型。在吉利的AI生态里面,其实已经有非常全面和领先的模型矩阵。
那么第一类模型就是语言模型,有语言和逻辑推理的能力,最具代表性的就是DeepSeek。吉利的星睿大模型已经深度融合了DeepSeek的能力,进一步提升人机交互和智能驾驶能力。
第二类、也是和我们车的场景结合得非常多的,就是多模态大模型,它这里面包含了有图像的理解和生成模型、视频的理解和生成模型、端到端的语音模型、还有音乐大模型。吉利的AI生态伙伴阶跃星辰是全球多模态大模型领域的领军企业。
第三类,也是我们认为会对未来产业产生更大影响力的泛世界模型,这里面有基于机器人场景提出的VLA模型,也有对未来更加本质的世界模型。包括刚才阿甘给大家介绍的吉利AI Drive模型,我们都做了深度合作和赋能。
从模型能力到应用落地,2025年也是非常关键的一年。根据OpenAI提出的AGI五级发展框架:
L1是聊天机器人,具有对话能力;L2是推理者,能像人类一样解决问题;L3是智能体,可以采取行动;L4是创新者,协助发明创造;L5是组织者,完成组织工作。
当前,AI技术正从L2“推理者”向L3“智能体”阶段跃迁,而2025年成为Agent(智能体)应用爆发之年是业内共识。我们认为,这个趋势会率先引爆Agent在车上的应用,让车真正从“出行工具”变成“出行智慧生命体”。
接下来,我想给大家举几个小例子,让大家对我们的多模态大模型更有体感。首先,是我非常喜欢的一个语音交互的例子。这里面的男生是一个AI,女生是一个真人,这是人和AI 的一个小小的有趣的互动,我们可以先听听这段。
我想这样一段对话,其实对所有直男都是好的教科书。我们就会发现,原来AI 比我们各位都会哄女孩儿。所以当我们比较现在AI 车端的简单交互的时候,我们会发现大模型能够给人更多的情绪价值,也能帮助我们完成更多体验。
除了语音交互之外,其实未来我们会进入到一个叫多模态交互的状态。所以我想给大家展示的是千里在吉利AI科技生态里,在手机上实现了这样一个动态的视频交互。
手机可以实时识别场景,查看小程序,搜索瑞幸咖啡,可以随便去点单去点外卖。获得新的导航体验。我想我们刚才展示的语音和视频的例子,说明AI已经给了我们完全不同的、人机交互的可能性
而且不光是输入,也有非常好的输出。这里大家所看到的所有视频,都是由吉利和阶跃星辰联合开源的,阶跃Step-Video大模型生成的。AI 让每一个普通人都能变成一个优秀的创作者,释放我们的想象力。
所以在这样强大的多模态大模型的赋能下,我想提出 AI+车 的第一个的趋势,叫做:超自然人机交互的诞生。
当我们从当年的PC机叫GUI,到我们的移动互联网叫Touch UI, 到我们认为现在真正能够Ultra,Nature 的UI,会给我们的车带来无限的想象力。
在这个领域,吉利整个AI生态走得是非常领先的。接下来,千里和吉利的生态联盟将会一起重新定义下一代的座舱操作系统Agent OS。它在技术上具备三个特点,超自然对话、Agent OS,跨域协同。这个Agent OS在今年内就会发布,它将打破传统座舱千篇一律的功能,给用户带来不一样的智能体验。
接下来,回到这张模型大图,我们把关注点放到泛世界模型。这是在我们的大模型矩阵里跟物理世界关联最强的部分。我想跟大家分享吉利AI科技生态两项最新的科研成果。
第一项科研成果,是在机器人领域机械臂的VLA模型。我们的团队是国内首个在机器人学习的基准测试平台——RLBench的跨任务测试中平均成功率达到90%的团队。我们的机械臂和灵巧手,已经能够完成上千个任务。非常重要的一点是,这样一个模型与我们最新的端到端智驾模型所使用的是同一套模型框架,都是Vision-Language-Action Model。这样的模型,未来在车上将会得到广泛的应用。未来,车不仅仅是智驾,更是我们第一个真正意义上拥有最强大脑的机器人载体。
第二项科研成果,是在全球领先的世界生成模型。随着我们的智驾技术越来越成熟、越来越收敛,我们会发现智驾比拼的不仅仅是算法和算力,还有数据。而在真实场景下能够积累的数据是非常有限的。举例来说,真实的车辆事故的数据,以及在极端天气下的数据,其实是非常罕见的。如果这些数据仅仅靠真实数据的回流,很可能无法满足智驾技术快速迭代升级的需求。因此,我们需要用一个仿真的世界生成模型,来生成大量跟真实世界一样的数据,来满足未来模型训练和模型快速迭代的需求。这就需要用到世界生成模型。
围绕世界生成模型,我们与吉利的AI Drive大模型有非常深度的融合,形成了强大的场景生成能力。这将帮助我们在智驾训练当中,生成许多不常见的数据,来帮助我们的模型更好地理解丰富和复杂的真实世界,从而极大地提升智驾解决方案的性能与准确度。
基于VLA和世界模型的能力,我想分享的第二个趋势,是未来不光是自动驾驶,还会有自动执行。所以在这样一个体系下,我们会认为未来的车真正就是我们最趋向机器人,和最大规模的机器人的落地的场景。
基于我们吉利AI科技生态领先的模型能力,在深度融合后,我们将推出全新的”AI+智驾“品牌——千里浩瀚,并且在今年,业界首个具备量产能力的L3级别智驾解决方案,就会在吉利的车型上搭载。陈奇总将会在发布会的下一个环节为大家做更详细的讲解。
讲完了模型,我其实想提另外一个在AI里面最重要的词:Scaling Law(尺度定律)。
我们中国的古话就叫做量变产生质变。
如果将行业目前主流的智驾大模型,与最前沿的基座大模型作个简单的对比,我们会发现两者之间在算力、算法和数据的消耗,有两个甚至三个数量级的提升。
举个例子来说,从模型的数据量来看,目前智驾大模型大约会用到1000万个视频片段,但是我们的基座大模型基本上要用到10亿个视频片段。从识别物体的类别来看,智驾识别的障碍物类别在几十到一百这个量级。大部分类别不能识别,就是简单归类于通用可移动/不可移动障碍物。而大模型的视觉识别种类至少能达到十万级别。所以我想这代表着真正的AI 大模型,比现在车上的智能化的模型要先进一到两代,但更代表我们在“AI+车”领域里面才刚刚开始,有巨大的潜力和空间。
所以,我想第三个大趋势是车联网大模型的量级升维。我们将会看到Scaling Law在车上,不止是车,也是在完整的车+云,这样一张车联网上面,真正去创新去孵化更多的AI加持的场景。
刚才阿甘也提到,吉利联合科技生态伙伴,已经成立了全球唯一的“智能汽车算力联盟”,这就是星睿智算中心2.0,综合算力提升到了23.5EFLOPS。这在所有中国车企中,绝对是名列第一的。有了这么强的AI基建,我们可以加速车联网的Scaling Law,真正将最强的AI模型赋能到我们的车上,打开未来无限的智能化体验空间。
跟大家总结一下,今天我的演讲想重点分享“车+AI”到“AI+车”的三个技术趋势,分别是超自然人机交互的诞生,自动驾驶及自动执行全面落地,以及车联网大模型量级升维。在每个方向上,吉利AI生态都有深厚的技术积累和产品布局,也会在今年不断给大家带来惊喜。
最后,我想以一支完成由AI生的视频,带着大家畅想一下“AI+车”的美好未来。视频描述的是在一个城市的雨夜,一个中年男人从老板办公室出来,走出写字楼。他掏出手机,一键召唤爱车。
在这里,汽车化身成了一个超级智能体,它不仅是名靠谱的老司机,更是情感的陪伴,让车变成了我们最智能、最舒适的“出行智慧生命体“。
我相信,在吉利AI科技生态的深度融合下,这一天很快就将到来!AI+车,未来可期!
(本文首发于钛媒体App,作者|林志佳)