作者|杨 璐
编辑|李国政
出品|帮宁工作室(gbngzs)
“听说杭州市领导想去‘DS’看看,结果对方说没空,因为要接待省领导,而且近期预约都满了。”
“‘DS’一出,XX公司又裁了好多人……”
这两句话,分别是同一天上班和下班时,在电梯中听到的议论,他们说的“DS”,就是DeepSeek(深度探索公司)。坐个电梯都能听到人们谈论它,可见DeepSeek火到了什么程度。
春江水暖鸭先知。竞争激烈的汽车圈,自当火速加入。
2月10日晚,在比亚迪智能化战略发布会上,该品牌宣布整车智能的璇玑架构接入DeepSeek。至此,吉利、东风、广汽、长安、奇瑞等十几家自主品牌加入DeepSeek大模型队伍,按时间线大致列表如下:
从板块来看,目前自主品牌基本都已将DeepSeek大模型接入智能座舱。
合资板块要慢一些。上汽通用是首家宣布DeepSeek上车的合资车企,凯迪拉克、别克品牌将陆续搭载应用。东风日产自称是合资当中首个实车接入的车企,新车N7已接入DeepSeek R1深度推理大模型。一汽-大众表示,将运用该模型革新营销模式,已接入新媒体AI内容运营数字化平台。
汽车行业原已公认,今年竞争的焦点在智能领域,而春节期间横空出世、惊动全球的DeepSeek,将汽车行业的智能化竞争推向新的热度和高度。
在比亚迪智能化战略发布会上,董事长兼总裁王传福提出“2025年将成为全民智驾的元年”,比亚迪10万元以下车型也能拥有高阶智驾;
2月9日,吉利汽车集团CEO淦家阅在2025年度经营工作大会上宣布,3月初吉利将发布“AI智能化战略”;
小鹏汽车董事长兼CEO何小鹏在春节后的开工信中提到,小鹏要打造“全球AI汽车公司”,此前透露2025年要投入45亿元研发AI……
中国车企正迎来“DeepSeek时刻”。DeepSeek就像一条引线,引出车企布局AI的野心,引爆车界智能化竞争的新热潮。
早有准备,春节赶工
在外界看来,车企疯狂接入DeepSeek,似乎是一种噱头。其实,自2023年大模型开始上车以来,车企已经重点关注该领域。
黄睿是东风研发总院软件工程研究中心下属人工智能实验室的主任工程师。他对帮宁工作室谈到,东风公司和研发总院一直对AI技术保持着敏感性。早在去年12月,就关注到DeepSeek,当时它发布了V3大模型,随即东风方面即对DeepSeek进行专项调研,集中人工智能实验室骨干力量、联合数十人进行相应研究。
目前,东风的AI研发工作,主要由软件工程研究中心执行,下设人工智能实验室、智能座舱、智能网联等团队。
今年1月20日,DeepSeek在V3版本的基础上,又发布R1大模型,这时东风立即研究上车方案。“春节休假期间,我们也在着手R1大模型上车接入。”黄睿说。
目前,东风公司的接入方案主要是通过东风云(参数丨图片)端接入DeepSeek的API,进入到智能座舱的语音交互链路中。
大模型热潮,始于2022年底ChatGPT面世。也正是在那时,包括东风公司在内,很多车企意识到该启动大模型相关研发。正因为有两年的研发储备,所以这一次DeepSeek来临时,相关车企才能快速行动。
过去两年中,不断有国产大模型问世,刚开始以大语言模型为主,逐渐发展到多模态大模型,以及端到端自动驾驶大模型等。
DeepSeek R1即属于大语言模型,车企主要将之应用于智能座舱内的语音交互。
对用户而言,该模型上车后带来的好处,一是语音交互的反应速度更快;二是语义理解更准确,交互更精准主动。
比如,车主是一名宝妈,要带6岁的孩子看电影,智能车机就可据此分析推理合适的电影清单。
除了直观的感受变化外,未来用户将深度体会到,智能化迭代速度越来越快。
对车企而言,DeepSeek提供了一种技术思路。黄睿介绍,DeepSeek给车企提供了模型蒸馏法的思路,这是一种将大型复杂模型(教师模型)的知识,迁移到小型简单模型(学生模型)的技术,核心目标是压缩模型参数和计算资源需求,同时尽可能保留模型的性能。
DeepSeek发布了R1模型的技术报告和蒸馏后的模型,基于此,车企可相应地研发和部署,东风、吉利等多家企业都是采取蒸馏的方式。
车企为何蜂拥而上接入DeepSeek?主要原因是,DeepSeek降低了大模型训练跟推理的成本,从而降低了大模型的应用门槛。“它在一定程度上挑战了传统观念,即大模型训练推理必须要用到大算力。”黄睿说。
在主机厂看来,DeepSeek的效果达到大模型的顶级水平,而且适配国产芯片,在训练推理方面达到较高的性价比。
岚图汽车相关负责人对帮宁工作室表示,接入DeepSeek主要有三方面好处:一是DeepSeek开源模型提供了能力强大的基座模型;二是在数据方面,帮助岚图自研AI智能体大模型,降低标注成本;三是原生的DeepSeek部署,帮助岚图本身提升工作效果。
未来,车企将运用DeepSeek的模型,迭代到智能驾驶、智能底盘等其它层面。1月28日,DeepSeek宣布开源视觉多模态大模型Janus-Pro-7B,具备生成图像能力。随着模型本身优化,车企将马不停蹄地升级功能。东风公司研发总院透露,今年6-8月,将释放多模态模型能力的功能。
接入只是第一步
近期,在接受晚点采访时,何小鹏谈到了对DeepSeek的看法。
他说,DeepSeek有两个技术细节,和小鹏的判断相吻合,其一,蒸馏是有效保存模型能力的方法;其二,巨大模型的蒸馏后效果,强于小模型的强化学习,而小鹏的强化学习就是在云端模型布局的。
何小鹏认为,大模型的训练算力消耗持续下降,同时推理能力持续上升,这一升一降利好自研大模型的主机厂,让整个产业更接近AGI(Artificial General Intelligence,人工通用智能),推动产业更快地从大语言模型走向具身智能、物理AI和现实世界。
“但DeepSeek主要是在数字世界领域深度探索,放到物理世界还很难。对后者,小鹏汽车有机会。”他说。
2月8日,特斯拉CEO马斯克在WELT经济峰会上,公开谈论了DeepSeek,表示“DeepSeek的代码效率令人惊艳,且中国有很多非常聪明、有驱动力的工程师。可以预料到,中国会创造出许多伟大的东西,而且已经创造出了许多伟大的东西。”
但同时,他表示,DeepSeek并不是彻底的革命,X AI和其它公司很快会发布比DeepSeek更好的模型。
提到AI的开源问题时,马斯克认为,开源模型通常落后于商业模型,不过,今天商业上强大的模型,可能再过一年或更短的时间内就会开源,“我预计这种趋势会持续下去,所以基本上每个人都将拥有AI”。
当开源越来越普遍,车企间的AI竞争将走向何方?
事实上,大模型接入上车只是第一步。之后,各品牌将根据车型定位、场景需求,做相应的优化和调整,这将是具有考验的部分。
商汤绝影CFO、前奥纬咨询董事合伙人,亚太及大中华区汽车和工业品主管张君毅表示,从通用模型到应用,中间要实现知识的蒸馏以及跨任务的泛化,这绝不是一蹴而就的工作。
他对帮宁工作室谈到,大模型开发需要算力、算法和数据,三者缺一不可,如今技术正从算力军备竞赛转向算法效率革命。“DeepSeek的推理算法给了一个很好的启发,数据蒸馏也是一种高效利用数据的方式。如果没有良好的初始数据,任何模型都训练不出来,更别说应用了。”
去年12月,前OpenAI联合创始人兼首席科学家Ilya Sutskever提出,“预训练时代已经结束了”。
“对于基础模型来说,公域数据已经差不多用完了。”黄睿说,“接下来,就是依托各行业或各企业的自有数据,如何发挥自有数据的价值、打造具有自身特色的功能很重要。并不是数据量越大越好,数据不加以清理利用则没有价值,高质量数据一直是稀缺的。”
DeepSeek大规模上车,表明汽车行业认可,但这并非拉开差距的根本。相关汽车研发人员对帮宁工作室表示,当今全球技术博弈的大环境,激发人工智能技术快速向前。未来一定会出现比DeepSeek R1更好的模型,因为技术会迭代发展,DeepSeek本身也会升级。
他们表示,在引入DeepSeek后,车企的智能水平如何,还要看应用真正上车后的表现。
毋庸置疑的是,2025年,由DeepSeek助燃的AI之火,推动汽车智能竞赛成燎原之势。