2025年,AI技术迎来爆发式增长,DeepSeek凭借“3%成本对标国际顶尖水平”的突破性优势,迅速成为行业焦点。面对DeepSeek的迅猛发展,企业是否真的能“接入即起飞”?哪些行业最适合接入DeepSeek?如何评估其商业落地的实际效果?
钛媒体企业数字化IP《数字价值观察室》2025年全新升级,围绕AI落地场景展开深度解析,通过数据驱动的方法,真实还原AI在产业中的应用表现。
《数字价值观察室·AI落地场景观察》首期直播,钛媒体集团联合创始人&联席CEO刘湘明对话RollingAI合伙人刘开,探讨DeepSeek商业落地的场景适用性。
RollingAI是一家AI咨询公司,从2022年开始就只专注于做生成式AI相关的项目。据刘开介绍,Rolling AI至今已经在中国落地了超过100个企业的生成式AI项目,同时上线了超过1000个AI agent(数字员工)。
在春节期间DeepSeek爆火之后,RollingAI顺应其大量客户需求,基于大量真实商业场景,对DeepSeek场景适用性评估,产出了一份专业、系统的商业落地指南。
针对DeepSeek是否适用于所有行业,刘开在直播中指出,脑力劳动密度较高的行业更适合接入DeepSeek,例如医疗、金融、教育等领域。但对于需要高互动、即时反馈的场景,例如电商客服、游戏陪聊、短视频营销等,DeepSeek的能力可能并不突出。他建议企业在决定接入前,要先弄清自己的业务需求。
除了技术上的适配,刘开认为,企业接入AI的技术门槛相对较低,真正的挑战在于业务壁垒,包括企业内部知识如何让AI理解、业务流程如何与AI结合、数据安全和行业监管如何应对等问题。
谈及AI的商业化落地,他表示,在医疗、金融等强监管行业,AI的商业化落地仍需6-12个月的适应期,需要完成数据合规、系统集成等多项准备工作。同时面对AI的发展,刘开认为,DeepSeek等大模型更像是“劳动者”而非传统的软件工具,企业需要从管理层到一线员工都参与进来,才能真正发挥AI的价值。
放眼未来,AI会如何影响企业发展,刘湘明表示, DeepSeek的出现只是AI企业应用的开始,就像马拉松比赛枪响后,大家刚跑出一公里时有一个跑得比较快的人,但接下来的路还很长。
附上本期直播时间轴,帮你快速跳转感兴趣的部分
02:41 DeepSeek的行业适用性 07:33 DeepSeek十大典型应用场景解析 09:42 DeepSeek R1与主流大模型对比 15:56 AI智能体的落地预期 21:33 DeepSeek的局限性与挑战 31:40 AI落地面临的技术门槛与业务门槛 37:28 企业转型在AI时代与数字化时代的异同 50:43 企业自评最适合DeepSeek的应用场景【以下为直播实录,经钛媒体APP编辑】 脑力劳动密度高的行业更适合接入DeepSeek
刘湘明:欢迎来到《数字价值观察室·AI落地场景观察》,今年春节期间,DeepSeek 成为行业关注的热点,短短一个月之内,全球下载量就超过了1600万,成为了史上最快突破3000万日活的 APP。
很多企业家也很关注,能否借助 DeepSeek迅速完成企业的智能化?今天我们邀请到了 RollingAI 的合伙人刘开先生,一起来探讨一下DeepSeek商业落地的场景适用性问题。
千行百业都在接入 DeepSeek ,哪些行业最适合接入DeepSeek?哪些行业在应用里面会遇到一些挑战?
刘开:从前年到去年,我们接触的做了生成式AI大模型项目的这些企业里,一些脑力劳动密度比较高的行业更适合DeepSeek这样的模型。典型的场景有医疗、健康、教育、金融服务等,想事情要想的比较透彻,逻辑性比较强的场景。
相对来说,一些比较偏商业营销的场景,对DeepSeek的需求就不会有那么大,比如说像游戏、陪聊以及一些零售的场景,更需要快问快答的能力,DeepSeek的专业能力就显得没有那么突出。
刘湘明: 有很多人很关心你这手上这份DeepSeek商业落地指南的报告,你们为什么要做这样的落地场景评测?
刘开:我们的视角相对来说是一个商业的视角。我们不比大模型跑分,不比科技视角的大模型特定能力。我们看的是过去两年做的这100多个客户的真实场景里面,把它换上DeepSeek,真的会变得更强吗?
我们的判断依据不是以绝对的准确率(来定性),因为很多商业场景是没有准确率的。比如说像一个销售的话术建议,是以它的灵活性,亲切度,对产品的理解度,扩展性等等多维的,用专家的方式,定性和定量综合去评估。
有些东西在模型跑分上它很重要,但一旦到商业场景中,用户的体感并不高,而有些事情用户体感特别高,客户很快能感知到的事情,在跑分上又不是很明显,我们的视角就决定了我们选一个偏商业化的视角,以真实用例为基础,信息脱敏后进行评测。
刘湘明:这个报告选了哪十类场景?
刘开:我们选了这十类场景,首先是因为这十类场景是我们在过去两年遇到的频率最高的场景,我们做了一些抽象的总结。
当然有一些部分,大家会发现我们有意没有放进来,比如说代码生成,一方面确实不是我们最擅长的事;另外,代码生成是一个用专业的计算机科学跑分和正确性评估就能够做出很好评估的领域。
刘湘明:你怎么看DeepSeek的表现,和传统的大模型去相比,DeepSeek哪些方面有优势?
刘开:我们有一个非常粗略的对比。
第一,不管是DeepSeek V3,还是DeepSeek R1,它并不是一个远远超出现在市场上主流的大模型的这么一个模型。不管是国内的通义、豆包还是海外的ChatGPT、Claude……我们并不认为DeepSeek R1和DeepSeek V3远远地超过了它们。
第二,我们认为主流的大模型可能都会比DeepSeek V3要强那么一点点。在商业应用领域,DeepSeek V3其实是要略弱于市场领先的文字大模型或者多模态的大模型的,当然它比较年轻。
第三,DeepSeek R1是一个很独特的存在,它是一个深度思考的模型,在一些需要深度思考的场景下,它的表现会远远超出市场领先的模型。但是我们发现DeepSeek R1受限于自己的推理速度、性能、效率、价格等各方面因素,加之真实的商业场景中,不是每一件事情都需要那么深度思考的,所以DeepSeek R1在一些特定领域里面会有非常好的表现,但是在那些特定领域又要被其他的能力,或者其他的模型要包裹起来,一起来使用。
我们内部有一个形象的比喻:有的员工快语快答,有的员工执行力很强,DeepSeek是每当你交给他任务,他都会说“老板你等等,我现在先不说,让我回去想想”,然后他晚上交出一个特别好工作的一个员工。
刘湘明:这个比喻真的还挺好的,报告里面也提到DeepSeek R1在数据分析、文档分类、策略生成这些场景表现得非常的优异,你觉得这些场景的成功应用,会给行业带来哪些非常具体的升级机会?
刘开:我们发现原来一些不敢想象的事情可以在这些场景里面去做了。比如以前用通用的大模型做一些深入的理解和方案的时候,需要用各种提示工程的知识库去限制它,甚至会用比较复杂的逻辑让它先生成,然后再用另外一个智能体去检查它的这种逻辑相关性、逻辑严密的问题,但今天DeepSeek表现出了非常强的逻辑能力。
下边这张图横向来看,是我们列出的8个最常被生成式AI或者大模型改造的行业,颜色越深代表效果提升越高。
例如,在医药健康行业,以前我们(用大模型)做了很多中医专家、营养学专家等领域知识专家,经常会担心它给出的内容、解决方案是前后矛盾的,或者是不完备的。今天,我们发现DeepSeek R1在这方面的能力非常强,非常让人放心。
另外一个案例就是在金融业,从一些企业级的金融服务,比如行业研究、行业报告,从投资标的的研究,到个人服务,比如说个人服务计划书生成、保险计划书生成、理财方案生成、动态理财方案调整……DeepSeek R1都表现出极其强的能力。我们有时候心里会想说,一些中等水平和中等水平以下的财务咨询师或者理财师,可能会面临一些职业风险。
DeepSeek商业落地的壁垒
刘湘明:你预测DeepSeek真正的深度应用,什么时候能实现商业化?AI医生、AI理财师的出现还需要多长时间?
刘开:市场总是会高估一项技术近期的表现,又低估它远期的影响。
即使DeepSeek有非常好的逻辑,但它对一家保险公司有多少产品、每个产品的卖点、核心用户、限制范围在哪等等还是不够了解的,这些要灌入进去。
而且刚刚讲的那些行业通常都是强监管行业:金融强监管、保险强监管、医疗健康强监管。强监管的原因就是不希望一些没有经过训练的人来操作或者给出错误的建议,导致人和财产的大量损失。监管层面要接受这些事,就要调整它的规则、规范。医院、医疗公司、药企、金融公司也要做对应的开发和备案,这个过程可能会长达6到12个月。可能今年年底或者明年,才会有非常优秀的AI医生、AI药剂师、AI理财经理提供服务。
刘湘明:报告里面提到了DeepSeek R1 在结构化的文本输出和这个角色扮演场景里面,表现的不如预期,一些方面不如市场领先的一些大模型。这种差距反映了DeepSeek在哪方面的局限性?
刘开:这就好像一个特别会思考的一个员工,当你让他以特定的某种八股文的格式输出一些信息的时候,他晚上交上来作业是非常优秀的,并且他会告诉你老板我把你的格式改了,因为你的格式不合理,这是可以理解,并且我们在某些场景会赞赏或称赞这些事情。
但是我们今天所有的大模型的输出,都要跟很多业务系统去对接。在跟这些业务系统对接的时候,我们有一些非常明确的不能改变的格式、指令、用名、参数……这时候它过多的思考和发挥就会导致系统崩溃。
刘湘明:未来,在使用的过程中,如何平衡DeepSeek的优势和问题?
刘开:我们把所有的场景总的来说分成三部分。
第一部分,内容输出场景中,我们认为当前的主流大模型依然超过DeepSeek,不管是DeepSeek V3还是DeepSeek R1。我们建议,如果已经实施了这些项目的团队或者企业或者场景,就继续保持用这个模型就好了。当然,刚开始实施的团队,你们可以做对比的实验,我们也可以帮助大家来做对比的实验,这一部分我觉得不要去动它。
第二部分,一些能力均衡的场景,比如说文档分类、打标签,DeepSeek的准确率在某些项目上是明显要高一些的,虽然它更聪明,但是却更慢,由此带来一些后果,比如说话术推荐场景,一分钟之后马上要改变策略,DeepSeek就很难满足,所以要平衡。
我们也发现在另外一些项目上,DeepSeek R1和主流大模型的表现很接近。原因是我们企业在设计的标签体系上可能就有一些疏漏,就有一些不合理、重叠、疏漏的地方。既然标签的定义本来就比较模糊,那对DeepSeek R1也好,对于主流模型也好,它都有答不对的可能性,所以它们会表现的很接近。
所以,大家要非常仔细地去辨别,私有化部署DeepSeek R1还是很贵的。
第三部分,做策略、方案等深度理解场景中,DeepSeek R1效果更好。但我们依然还是有时间、实时性,价格或者成本上的考量。所以,我们可以考虑用各种方式,做主流大模型和DeepSeek R1的融合。
例如,我们近期合作的一家ToB企业要给它的客户提供各种各样的解决方案,我们现在的解决方案就是:用DeepSeek R1针对它100种不同的客户场景需求,生成100种方案模板;然后用市场上领先的优秀大模型,去仿造这个模板做更个性化的调整。打个不恰当的比方,就是让DeepSeek R1做作业,让主流的大模型去抄作业,主流大模型抄得又快又好又便宜。
当然这是一种融合的模式,还会有更多融合的模式。比如,有的是把策略规划的部分给DeepSeek R1做,然后把执行的、补充的,比如说提纲,认识文字的事情交给主流大模型做。
刘湘明:这几个月来大家使用DeepSeek R1,“惊艳”是一个关键词,“慢”是另外一个关键词。你觉得“慢”的问题,能不能通过算力的提升去解决,还是说这就是DeepSeek R1的一个特点?
刘开:首先,我们现在经历的“慢”,主要是投入在DeepSeek上的资源不够。不同的云厂商投入了足够的资源,大家体验就会好。
其次,它生成文字的速度依然可能会比主流的模型要慢一些,这是因为它的思考更有深度,它底层的思考链更复杂,这个思考过程正是它强大的地方,但也是它不可避免的时间消耗的地方。在这方面,我们只能期待DeepSeek团队或者所有的大模型团队,逐渐改进整个推理逻辑,或者改进整个推理效率,不过这个改进的速度会比较慢一些。
刘湘明:也有很多人,可能特别希望能够快速地去搭上DeepSeek的快车,怎么去尽快地部署和落地,那你觉得DeepSeek在落地和部署过程中,技术的门槛和业务的门槛,哪个是更难跨越的门槛?
刘开:技术的门槛我们面临的比较少,因为今天已经有包括云厂商在内一些非常不错的企业,在提供类似的服务。但作为一个大企业,想要有一套自己私有化部署的DeepSeek,从买卡,到组成整个计算集群,到搞定所有的网关安全,最后把DeepSeek跑起来,其实没有那么容易,大家把它想象的太容易了。
业务上的瓶颈和壁垒也非常多。很多企业说如果部署了DeepSeek,我能不能把企业的知识全部给它,然后问它什么就答什么。这是远期的发展愿景,但是在近期的发展上会有很多事情需要准备,比如说一家企业的知识,可能有重复和冲突,有些规章管理制度,A事业部和B事业部要求不一样,该怎么办?企业有很多术语是在日常工作中逐渐积累下来的,那要怎么整理好,让它跨越这种知识壁垒?
跨越完知识壁垒,还要跨越业务集成的壁垒。因为DeepSeek生成的文案是要接入媒体管理系统、CMS系统(内容管理系统)的,生成的业务销售跟进策略是要进CRM(客户关系管理系统)的,生成的OKR要进人事系统,要跟这些系统打通,而DeepSeek并不管理这件事。无论是传统的系统也好,还是企业的业务中台、知识中台,要把这些集成起来,并没有那么容易。
最后,即便这些都处理好了,我们也可能会发现企业在做一个场景的时候,它的最佳业务服务流程并没有被总结出来。不管是业务方案、保险计划书的生成,甚至新媒体的小红书、短视频的剧本生成,都需要有这些行业know how在里面,而这些行业know how得从这些行业、企业最顶尖的专业人才脑子里面提取出来,放到AI里去,这是今天落地DeepSeek的另外一个业务壁垒。
刘湘明:真正从零开始落地一个大模型,不管是DeepSeek,还是说其他的大模型,企业需要做的事情,跟原来做信息化、数字化的流程有什么不同?
刘开:和企业做信息化,数字化会很接近。但现在企业需要做的事情本质来说有两句话:从上至下地定策略,从下至上地长文化。
从上至下的定策略包括很多方面,比如说我们会建议所有的企业把自己的数字化的团队、业务的团队、管钱的团队、管理团队拉到一起来,在企业的所有的场景中找到一两个机会,开始做第一个项目或者做第一个落地。通过做一些务实的、确定性高的场景,做成了能提升所有团队的成就感,进而能往前再推一步。这就是建立信心,建立团队的过程,然后一直往前走,走到实现长期策略。
从下往上做文化,比如公司的员工还没有用上大模型,就先用起来。公司的IT千万不要禁这些应用,千万不要禁这些端口,让他们能用起来,能用就有体感,有体感就有需求,有需求就有推进,就有创新。
然后,我们会建议企业一些核心的中层、高层去接受一些适当的培训,毕竟大家工作时间都很忙,没有那么密集地整理过信息。可以上一些提示工程的课、AI Agent的课、AI 案例商业的课。
我们也鼓励公司进行创新文化建设,做一些类似于像创新大赛、效率先锋的活动,让年轻人、业务一线把需求提出来,把Demo或者AI的原型磨出来。企业的管理层要给年轻人、创新的人多一点点资源、多一点点容忍、多一点点保护……这个文化长起来,企业就会逐渐自我更新。
AI大模型短期内不会让企业数字化系统消失
刘湘明:企业多多少少都建立了一些信息化系统,数字化系统。未来,大模型跟现在的系统的关系会是怎样的?
刘开:我个人的观点会比较激进,我希望把所有的AI应用或者AI智能体更看得像一个员工、而不是一个系统;我会把它的研发过程看得像一个员工的培训,而不是一个系统的研发;把它的上线过程看得像一个员工的上岗、评估和下岗,而不是一个系统通过了checklist(检查清单)的测评上线。如果以这个思路来看的话,我认为所有的业务系统就在底层提供它原有的能力,而AI的能力附加在它之上,现在系统或多或少开放了一些接口给AI去输入和输出。总的来说,我不认为原有的像SAP这些管理系统会消失,至少在短期内不会。
我的合伙人也有他不同的观点,他的观点是这些系统都会消失。我们现在用AI智能体在管理我们的销售线索,他更多负责商务,他的销售线索都在智能体的脑海中。他现在不需要开周会,不需要一个销售Pipeline的报表,因为他有问题就问智能体,他有知识就告诉智能体。
刘湘明:还有一个更现实的问题,很多企业家关心,用DeepSeek贵不贵,成本怎么样?
刘开:就看跟谁比了。如果是私有化部署DeepSeek,我们现在看来还是挺贵的。最近我们刚帮一个企业评估了一个场景,场景的功能其实特别的单一,就是做一些话术输出,但是量很大,可能一周几十万份。我们评估出来,要有150万的硬件投入,此外还要再投入智能开发、软件等等,我们觉得ROI(投资回报率)不划算。
但如果从云端使用DeepSeek或者其他主流大模型的ROI来看,非常值得去投入使用。比如,我们在帮中国最大的一个租房企业做智能化改造的时候,有一个很小的功能,叫做智能立单。当租户打电话给管家说漏水了,管家挂掉电话以后,他会在系统里面花大约五分钟时间去填报这项记录,以这个管家员工的人力成本算下来,这五分钟大概是两块二毛钱。而通过AI读取这一段对话,不仅可以把整个单立好,而且错误率几乎为零,成本可以做到三厘钱。虽然每一单节省的成本看起来并不多,但这家企业一天好几万单。因此,即便投入几十万来做一个智能立单的功能,其实也是非常划算的。
我们看待的是AI或者大模型,不管是DeepSeek还是其他的大模型,它在提供的其实不是一个软件功能,它在提供生产力,它不像一个劳动工具,甚至它有点像劳动者,有点像劳动者的助手。这个我觉得是我们在商业思考层面一个很大的变化。
刘湘明:我觉得很大的一个问题是,一代人面临着知识结构的更新。对企业来说,非常现实的问题是原有的团队怎么去融合,是不是有很多的矛盾?
刘开:今天我们还在一个MBA的分享课堂上聊到,有个企业家说,我的企业有非常多的老专家、老师傅,怎么做这个业务他最熟最懂,我能不能把他的知识放到智能体里面?我现在业务扩展不开了,我把知识放到AI里面,就可以为更多的人提供服务,甚至可以给东南亚的商户提供服务。我说,逻辑上、技术上都可行,但是你得让老专家同意。一个最优秀的团队,我们会发现它最重要的知识不在文档里面。尤其是销售型的企业,最好的销售知识都不在企业的培训文档里面。但是它都在企业里面,都是一个老师傅带着徒弟,老销售厉害,徒弟也厉害。
即便老师傅把知识给出来了,我们还要用知识库、搜索引擎这些东西要去承载、优化它,这些事情确实是我们遇到的非常非常大的障碍。
刘湘明:在保证DeepSeek技术优势的前提下,如何跟不同行业的业务需求契合,从哪些入手?你能不能给一些建议?
刘开:大家可以用两个问题去筛选,哪些东西是最好用DeepSeek做的。
第一个问题,在我的企业里面,哪个部门,哪个工作是智力密度最高的?智力密度最高的部门里面最花时间的事,通常它不会是一个决策性的事,它通常是一个知识梳理、知识理解、信息整理的事,这种事情是DeepSeek最擅长的东西。
第二个问题,如果今天在业务上有1000个清华北大的应届生,你会让他们去做什么工作?
这个问题兼顾了两个方面的考量:第一个方面是智能(智力)方面的考量,今天的大模型在很多能力上是可以接近大学生的智能水平,但是它跟大学生一样,它不懂企业内部信息、不懂企业业务,不懂企业知识,不懂企业“黑话”,如果大学生能做,就可以试着训练AI可能也能做,如果大学生不能做,要有一个老师傅带着干五年,那先不要让AI干这样的事情。
同时,也考量了企业经济效益。如果需要两个实习生干这件事,那就请两个实习生干就好了。但是你如果需要1000个实习生或者1000个清华北大毕业生,以前你请不起这1000个清华北大的学生,今天这个几乎免费。
大家可以用这两个问题,去反思企业内部哪个场景是最好用大模型实现的。
刘湘明:感谢刘总这一场非常务实的分享,我们相信DeepSeek的出现,只是AI在企业应用里的一个开始,就像马拉松比赛枪响完了,大家可能刚跑出一公里,先跑出了一个跑得比较快的人。未来路还很长,我们也会持续关注和探索。谢谢!
以上为《数字价值观察室·AI落地场景观察》首期直播的部分内容,完整版请观看《“接入DeepSeek”就能原地起飞么?——探究DeepSeek商业落地的场景适用性问题》。
想要获取完整版报告,请点击链接《DeepSeek商业落地指南系列I——场景适用性评估》查看。
(本文首发于钛媒体App,作者|唐刚,编辑|华楠、盖虹达)