2025开年,号称“数字化攻坚最难阵地”的医疗行业又迎来了一波AI落地的新高潮。

在DeepSeek拉低大模型的使用门槛后,药物研发、疾病诊断、个性化治疗和慢病管理等多个领域的代表企业应声而动,有接入AI能力赋能业务场景的,有发布全场景智能体的,有开源垂直模型和数据集的……回顾医疗行业数字化的历史,会发现AI医疗的真正挑战,往往不在单点的技术,而在场景之深,并非引入领先的技术就一定能如愿转为业务价值,能理解场景需求,精准解决痛点才是落地关键。

对于蜂拥接入各类领先大模型的医疗企业,各类模型是否适合自身的业务场景?如何把相同的工具用出差异优势?《数字价值观察室·AI落地场景观察》第三期直播,钛媒体集团联合创始人&联席CEO刘湘明对话方舟健客技术高级副总裁郭陟,将以“互联网慢病管理”这个垂直场景为代表,探讨AI落地的适用性和面临的难题。

作为“AI慢病管理第一股”,方舟健客在DeepSeek爆火之前就一直在探索AI的场景应用,将AI、大数据等新兴技术用于旗下“H2H(Hospital To Home)智慧医疗服务平台”的打造,郭陟认为慢病管理是医疗行业内有千亿级市场规模的垂直领域,AI在医生问诊提效和核心业务运营效率优化等环节有充分的价值发挥空间

3月21日发布的上市后首份年报显示,2024年度,方舟健客录得收入人民币27.07亿元,同比增长11.2%,经调整后净利润达1711.9万元,同比增长139%,月活用户数量同比增长20%,这些数字背后有多大程度AI的助力?

对于具有严肃和不可逆等特性的医疗领域,郭陟认为“模型幻觉”‘和数据安全“问题,是亟待需要突破的两大技术难题

对于AI在医疗场景落地的未来,郭陟认为,算力和通用模型这类通用能力可以让AI+医疗的落地应用达到60分的及格线,但是要想达到80分甚至更高,取决于专业领域的算法以及准确、高质量的数据,而这些都来自对业务痛点的理解和协同。


附上本期直播时间轴,帮你快速跳转感兴趣的部分

03:39 医疗健康为何成为AI落地的第一大场景? 06:08 AI在H2H生态体系中的具体应用 15:33 如何降低模型幻觉和保证数据安全 26:00 未来医疗模式会如何变化? 40:01 如何看待医疗行业开源?
医疗健康,为何成为AI落地的第一大场景?

刘湘明:DeepSeek大火,进一步加速了AI在千行百业的落地,很多人公认医疗大健康领域是AI落地的最佳应用场景之一,为什么这个场景具有AI适用性?

郭陟:以我们所在的慢病服务行业为例,慢病服务这个行业产生的一大背景就是,我国老龄化进程加速但医疗资源分配不均。国家统计局的数据显示,2024年底我国65岁及以上老年人占比达15.6%,比20年前增长一倍以上,还有数据显示,我国75%以上的老年人至少患有一种慢性病,例如高血压、糖尿病等,慢病管理慢病服务相关的需求日益旺盛,但同时好的医疗资源都集中一线大城市,医疗资源分配非常不均衡,对于慢病管理来说非常不友好。

首先就会产生问诊难的问题,例如偏远地区的老人,可能没办法享受到优质的慢病医疗资源,即使是一线城市的病人,也会有挂号难的问题,需要抢号。

诊断后,慢性病患者需要长期用药,且有一些药是要准时用药,但是对于一个患者来说,如果说这个疾病不是致命的,例如高血压,糖尿病,患者在一开始用药可能还挺积极的,例如设个闹钟,但是过了半年,感觉病情不会要人命,就无所谓了,用药的依从性便得不到保证,导致治疗效果不佳。

最后一些慢病患者长期治疗中可能会有其他并发症,或者患有其他疾病,但是不知道跟原来疾病之间的关系,这种情况下如果到网上去找信息,容易获得零碎的,甚至是错误信息,导致医患之间的信息不对称。

医疗资源供需矛盾在慢病服务场景中产生的问诊难、用药依从性差、信息不对称这一系列的问题,就具备很强的AI适用性。AI技术可以促进医疗资源的最大化利用,让有限的医疗资源可以普惠大众。其实大模型面市之前也有很多的AI改善方式,现在大模型能做更多的事情,改善效果可以从原来的几倍,到几十倍甚至几百倍。


刘湘明:如您所说,在AI普及之前,这个体系中例如互联网医院、送药到家这些事情,原来就很多企业都在做,现在哪些业务场景里面,您通过引入AI技术,让它变得跟原来不太一样了?

郭陟:在整个体系里引入AI非常多,核心在于前面提到的几大痛点问题,会通过AI优化几大的这个核心业务去解决这些问题。

比如在互联网医院,其核心是怎么提升医生的效率。以一个优质的专家为例,原来一天可以看150人,如果医生的问诊效率能提升,能翻倍甚至十倍,其实就能够解决一部分程度解决患者问诊难的问题。在这个方面,我们是给医生配了AI医生助理,这是第一个场景。

另一个场景,是针对慢病管理服务,逻辑跟医生类似,平台上的管理顾问是有限的,所以我们给顾问提供一个AI客服助理,AI助理能够辅助顾问服务更多的用户。

最后一个就医疗科普新媒体,我们通过应用大模型,打造了一个AI创作助理,这样能给新媒体编辑赋能,这是非常成功的一个场景应用,我们会把一些场景聚集在一起,针对科普领域做AI创作助理,这个AI小助手应用,可以让编辑发大量的、个性化的科普内容,以解决医疗科普信息的不对称问题。

刘湘明:刚才您谈到的AI医生助理,现在具体的应用场景有哪些?对用户以及对医生的工作,会带来哪些影响?

郭陟:医生助理的应用场景是比较多的,我们的AI医生助理,应用场景是完全贴近方舟健客的客户业务,建立在熟人医患关系中。也就是患者见过医生,建立了联系之后,需要复诊或者有其他一些问题,就可以在我们的互联网医院直接去找这个医生,这样可以节省双方的时间,并提升诊疗针对性。

但同时会产生一个矛盾点,我们平台上大多是知名的医生,至少是主治副主任和主任医生,他们的时间是非常紧张的,所以他们大多是用碎片化时间做在线问诊,在线问诊过程中,他们会发现,患者经常问他们一些重复性问题,以及一些特别简单基础的问题。医生端会觉得重复,回复的效率很低,且倾向在线下工作之后的空余时间集中回复患者的问题,一条回复可能就足够。但是对于患者来说,都希望上线后一点击这个医生,给他发条消息,他马上能回复,而且医生要不厌其烦地回答他的问题。正是基于这个矛盾点,我们构造了AI医生助理,让他来连接医生和患者。

当AI医生助理发现患者问的是一些简单、重复性的问题,他可以针对这些问题进行一些回答。比如问的是药品知识,根据药品说明书回复就是非常确定的,再例如针对疾病保健、运动饮食这些方面问题的回复都也很明确,这些都是AI医生助理可以回答的。

如果患者是不舒服来咨询症状,AI医生助理也可以给患者做初步的症状收集以及初步的分析,等到医生有空的时候再来接诊,也就是把最重要的诊断转给医生来做。

我们的AI医生助理相当于是搭建了一个患者跟医生之间的桥梁,通过这种方式可以快速响应患者咨询,同时也能提升医生的接诊治疗和效率,让医生服务更多的患者。这就是医生助理这个智能体的业务场景。


刘湘明:在医生助理场景中,都用了哪些模型的能力?DeepSeek R1的功能应用会更显著一些吗?

郭陟:医生助理背后的大模型是比较多的,因为医生的任务是多样性的,我们的智能体会把这些特定任务进行分类,再交给不同的模型去处理特定问题。

例如,针对药品的问题,我们会先走RAG知识库,拿到我们内部的知识信息,有了这些确定信息之后,再交给DeepSeek V3模型去回答。

刘湘明:是DeepSeek V3,而不是R1,没有推理。

郭陟:对,不用推理,在这个场景,做一个问答就可以。不仅是因为推理模型回答会慢,还因为推理模型有时候会产生大模型幻觉,这在医疗领域是有风险的。

再比如针对一些特定的任务,例如患者是希望你给他做一个症状的初筛,甚至更往前一步,希望做一个自诊,那这个时候就要非常谨慎,我们就会用一个我们基于开源模型微调的小参数模型,输入我们自诊的SOP,让患者根据这个流程来进行自诊。这个模型实际上只负责收集信息,收集完信息之后,再交给另外一个微调模型来给初步的建议。

此外还有一类可能会涉及敏感问题,我们会用一个规模更小的模型去增加信息的确定性,然后给出拒绝的回答。

如上说述,针对不同的任务,我们是会用不同的模型去应对。包括前面提到的DeepSeek R1推理模型其实也有它的优点,我们会利用它的推理能力,把它当做一个监督模型,类似教师,例如把R1回答某些特定问题的思维链固化,然后放进前面V3回答的那些问题里,帮助回答的准确度。

我们是通过这种方式,充分利用不同模型的特点,让所有这些分类任务的回答,保证最大可能的准确度。

刘湘明:针对患者自诊的结果,最后由谁来确认呢?

郭陟:首先任何模型肯定是不会给出诊断的,严谨表述应该是初筛,在这个环节模型只是收集信息,给出一些建议而并非诊断,诊断这个动作是必须医生来做的。以及如果在节本问题的问答过程中,如果大模型发现他自己回答不了,或者是患者强烈要找医生,也还是会走到转医生这个模块,大模型会把之前的的沟通记录以及总结的摘要求同步医生,让医生再给出一个诊断。

刘湘明:您刚才介绍的这些AI助理中,是不是医生助理的开发难度和复杂性是最高的?

郭陟:是这样的,一方面是因为医生助理要处理的任务最多,其他AI助理处理的任务相对会少一些。另一方面,医生助理的严谨度、准确度要求是最高的,其他AI助理的准确性稍微低一点,是可以弥补的,但是医生助理的准确度低是绝对不行的。

模型幻觉和数据安全,AI落地医疗行业的两大技术难题

刘湘明:虽然医药场景具有很强的AI适用性,但同时这个行业具有很强的专业性和严肃性性,AI落地会遇到哪些问题和难点?

郭陟:确实,医药场景除了场景格外丰富外,是一个对业务专业度和严谨度要求非常高的领域,难点其实非常多,最重要的会集中在以下三点。

第一个难点是AI落地需要有既懂技术又懂业务的专业团队。现在虽然大模型很多,应用很普及。各行业各企业都在接入并应用,但是大多数情况下其实并不知道,所在企业如何用好AI。这时候就需要有一个专业的团队,能够把AI应用跟企业业务结合起来。这个专业团队不仅仅是一个技术实施团队,而是既要了解技术,又要了解业务,还要非常非常懂 AI,这是要求挺高的。

第二个难点就是医疗场景是对误差容忍度比较低的行业,但是以大模型为代表的AI,尤其是推理模型,容易产生模型幻觉,所以大家会看到有时候大模型会“一本正经地胡说八道”,这对于医疗行业的应用来说是致命的。必须要解决模型幻觉的问题,这是AI在医疗场景落地要迈过去的最难关口。

第三个难点就是安全合规问题。数据安全是要得到保证的,相关应用是要合规的,而且在医疗领域还会包含伦理上的问题都要解决,所以说安全合规,这相当于是落地的第三个难点。

刘湘明:对于您提到的模型幻觉问题,从模型工程的角度来看,该怎么去降低医疗场景中模型幻觉的影响?

郭陟:关于降低幻觉的方法,一般分成四步来进行。

第一步是需要建立一个准确知识库,然后通过RAG的方式转化为搜索出相关的文档内容提供给大模型来,并指导大模型回答。在这一步中,知识库的丰富度和数据质量是关键衡量指标,方舟健客平台运营至今,积累了超4920万用户和22万医生专家使用,此外平台上有超21万SKU药品的说明书,以及海量发布的科普文章,这些丰富的数据积累是构成知识库的基础,除了丰富的数量外,数据的质量是更为重要的,基于业务场景的数据和知识沉淀,是方舟健客的知识库差异化优势。

当然,基于庞大数据的清洗工作量肯定是巨大的,这也是构建知识库的关键动作,我们首先会用传统算法结合大模型算法会去做清洗,先做自动化清洗,然后人工清洗,对于医药场景而言,人工检查的环节非常重要,此外对于重点知识内容还会再增加抽查,通过多重核验,保证知识库内容的准确性。

其实大模型的确定性回答也可能会产生幻觉,只是概率会小一些,因此有了知识库之后还要进行第二步,就是根据知识库和相应的数据,再提取一些知识图谱和一些业务规则构成图数据库,用图数据库去给大模型做一些限制。这些基于规则的限制,会让大模型不会越界,而且很可靠。

第三步才来到大模型回答阶段,针对问答中一些特别敏感的问题,需要微调一些参数比较小的模型去回答。这个时候,我们会基于知识库的核心内容,从里面抽一些样本,然后再去做一些多样化的处理。然后通过样本微调一些模型进一步增强模型回答的确定性。当然这阶段可能增强确定性效果,没有像前面两个阶段那么显而易见,但是在医药场景,任何可以提高回答确定性、准确性的努力都是值得尝试的,准确无上限。

这三步做完之后,最后就是定期测试大模型的整体效果,一方面监测效果,另一方面避免模型漂移。大家也知道一些外部模型,在使用过程中有时候会产生模型漂移,定期的监测就很重要,如果发现性能和效果有下降,我们就会及时回过头,从第一步开始去溯源,一步步重新再去做优化。这其实是一个标准的处理方案,只不过在医药场景我们做这个事情会相对会做的比大家更认真一些。

刘湘明:以您的经验,这个漂移大概多长时间会发生?或者说这种现象是否很常见?

郭陟:不同模型会不一样,但是漂移发生是必然的。首先,模型的训练数据是会随时更新的,会补充新的训练数据进去,而最近两年新的训练数据很多都是大模型产生的,中间必然是有幻觉产生,所以模型必然会发生漂移。

那么只能针对漂移去针对性处理,现在有两个方法,第一个就是针对特别敏感的一些问题,就用传统的开源模型,我们自己微调使用,另外针对能力强大的模型我们肯定也得用,就提高监测频次看是否产生漂移,如果产生漂移,就针对这一块的内容去识别,然后通过其他知识库和微调的方法纠正过来。

刘湘明:对于数据安全的问题,您是怎么来应对的?

郭陟:在方舟健客之前,我也做过很长时间的安全行业,对数据安全的问题理解是非常深的。虽然在目前的互联网环境下,绝对的安全是非常困难的,但是我们还是要努力,尤其是在医疗健康这个对风险偏差零容忍的行业。

我们现在的解决方案主要是构建了一个安全管理平台,这个平台核心是解决两方面的问题。第一个是构建一个数据安全沙箱,我们现在的原则是,凡是企业内部数据,肯定是私有化本地部署的,部分数据也会调用云端算力,最后是一个混合云的架构部署。在这个方案里,整个数据流转过程中,会对所有的入口进行防护,传输加密、存储加密、日志审计……这些传统安全措施肯定都要用一遍,同时我们所有的数据都有一个分级控制的标准,对于外部模型或云端算力的需要调用的本地数据,达到我们的三级或者四级以上的数据,我们就会要求进行脱敏,会通过一个模型,对这部分数据做泛化或者加密,只要不影响模型的答案结论,会以数据安全作为第一准则。

除了数据安全之外,合规性问题也必须要重视,我们首先会做内容的安全过滤,通过设置敏感词规则过滤体系,用AI屏蔽敏感词和违规内容。另外大模型应用中,也要非常重视个人信息保护和知识产权保护。

我们会通过区块链技术,对于大模型产生成果的整个链路进行确权和留痕,此外针对所有模型的回答,我们会用DeepSeek R1来做一个监督大模型,协助过滤违规风险内容、偏见内容。


刘湘明:如您所说,方舟健客这套智慧体系中,有监督模型、数据加密模型,整个体系里面到底现在部署了多少模型?

郭陟:非常多,单就医生助理这一个场景功能而言,至少就有十几个。

这是医药行业的特殊性造成的,那些大一统的框架,虽然应用起来很快,但是出问题的时候也很麻烦,在医药行业适用性反而会差。

我们做这套体系有一个原则,就是对于这种智能应用希望是分而治之。因为分而治之,每个任务最后才能走向确定性,而且单个任务有问题就不会影响到其他任务。

AI 时代,未来医疗的新竞争层级

刘湘明:未来,在人工智能体大量参与的情况下,整个医疗行业的服务逻辑和传统模式会不会有很大的变化?

郭陟:传统模式下,医院以及互联网医院的核心就是医生,人类医生是一个核心的决策单元,各类AI应用也是辅助医生做的,比如说帮医生整理一下病历,帮医生辅助看一下CT图 、B超图,标注出来,最后让医生再确认。但是未来,可能会从传统模式演变成智能体模式,AI医生助理能力会慢慢提升,会变成一个真正的数字员工独立干活。这些数字员工有可能会组成一个智能体的网络,互相学习,能力进一步提升,医疗领域可能会形成人类医生和AI智能体的混合决策网络。

刘湘明:原来医疗体系还是以医生为中心去构建的,将来如果变成一个混合模式的话会带来很大的变化。您估计这种这种状态大概需要多长时间?

郭陟:这里面涉及很多伦理的问题,我可能要保守一些预估,五到十年。


刘湘明:刚才您谈到了很多的智能体,基本上是在单点上辅助,其实还没有一个通用的智能体,把整个的流程都都串起来。最近Manus这个通用智能体很受关注,您觉得未来会不会有一个类似这样的通用智能体去把单点智能应用串起来?如果出现,是否会形成竞争?

郭陟:通用的智能体和各个领域专用的智能体并不是竞争关系,而是相辅相成的关系。

我喜欢把大模型和智能体类比成人,通用的智能体可以被认为是一个知识非常渊博的应届生。当然这个应届生水平会从高中水平,到现在的博士水平或者更高,而且是全领域的博士。但是就算是全领域博士,如果要去做一些特定企业内的一些工作,也是需要再经过培训的。例如医疗领域相关的这些工作,尤其是针对企业私域的一些知识,是他过往训练中无法获得的,比如企业的业务知识和流程,这些企业特定的know-how必然是一个通用智能体无法掌握的。

因此,通用的智能体也好,通用的工具也好。到了医疗特定的企业里,一定是有一个跟业务模式结合的定制过程,否则,他能力再强也起不到作用。得医疗专用的智能体,未来一定是会有非常大的市场的。

刘湘明:原来的医院竞争基本上是谁有好的医生,谁就会占据更大的竞争优势,AI促进下未来医疗行业会不会进入到一个新的竞争层级,比如说数据资源更多的企业或者医院会掌握更大的这个竞争优势?

郭陟:这个趋势是存在的。过去模式下,医生是医院的核心资源,未来智能体发展起来,医院可能会进入一种智能体密集的状态,而智能体依赖的最重要的三要素包括算力、算法和数据。在算力资源相当的情况下,算法能力和数据资源将成为未来医疗行业非常重要的竞争力。

刘湘明:您觉得未来AI公司有没有机会在医疗领域迅速的崛起?就像当年互联网公司一样。

郭陟:AI公司至少可以分成两类,一类是通用能力型AI技术公司,类似智谱、月之暗面等,这些公司只要能够实现技术突破,其业务就能够指数级增长做到快速发展;第二类还是需要回到应用场景讨论,比如说医疗领域下有非常多的垂直细分领域,每一个细分领域都有很大的AI崛起的空间。

刘湘明:在这个格局下,方舟健客的怎么样用出AI的差异化呢?未来的竞争优势又在哪呢?

郭陟:AI发展取决于算力、算法和数据这三个方面,算力以及通用模型算法在医疗行业是比较难跑出差异性的,这方面,我们基本上就会采用生态合作的方式,例如跟腾讯云等战略合作,通用模型层面,我们也是接入了市面上大部分知名的模型。

对于绝大部分企业而言,搭一个大模型平台并不难,但是难在如何真正把AI用好,这里面会涉及很多细分的场景,细分的工作,需要专属算法和相应的垂直数据,针对这些专属的算法和数据,我们在四个维度上是具备优势的,这四个维度也是我们内部的针对AI应用的一个指导思路。

业务为源、分而治之、平台驱动、数据为本

业务为源很好理解,我们做AI的应用,肯定是要贴近业务,建立最佳实践,AI要跟业务模式深度捆绑,才能建立独家优势。以前面提到的AI医生助理为例,看上去AI受到了很多限制,但实际上它是最适合慢病管理里熟人易患关系这个业务场景的,可以帮助我们大幅的提升问诊效率,能促进业务快速发展,而这个智能体放在其他的场景,可能价值就没那么明显了。

分而治之指的是我们不会去追求大而全的解决方案,而是针对每个环节做细节优化,希望通过这种细节的逐步积累,最终形成合力。比如说医生助理的很多任务,都拆分的很细,让不同的模型去解决不同的问题,最终长期积累,形成AI助理的差异性综合能力。这里面考验的还是对单个业务痛点的理解以及解决方法的积累,方舟健客的真实医患互动经验积累,是核心壁垒。

有了这些积累后,需要技术上的沉淀,平台驱动。一方面我们搭建了智能体的开发平台,不仅我们的这个AI团队可以在平台上搭建,公司内部的所有员工,只要有一定能力,都可以在平台上搭建智能体,久而久之,很多业务的流程就会慢慢的都迁移到平台上,非常有利于整个企业的 AI转化。另一方面,基于是同一个平台开发,安全合规策略就非常容易推进了,这些都是平台驱动所建立的优势。

数据为本,为了最小化模型幻觉,我们需要准确和专业的数据。这里面不仅要有一些医学相关知识的数据,也更多的是要积累这个跟业务和管理相关的数据,这样建立的知识库才是有差异性和竞争力的。

刘湘明:DeepSeek其实开了一个好头就是开源,您怎么看待开源在医疗领域的可行性和价值,方舟健客是否会跟进?

郭陟:开源行业模型和数据集,是可以加速医疗领域AI技术的普及和标准化,这肯定是个好事,我们也非常赞同,但是这些行业模型和数据集开源之后,如果要利用,其实还是需要依赖一个AI的专业团队。很多基层的医院,甚至是公立机构是最需要这些模型和数据集的,但是往往他们会缺少既懂AI技术,又能理解自身业务场景的团队。所以往往最后变成了对专业的科技公司实现价值最大化,但是对广大更有需求的基层医疗机构,价值有限。医疗机构还是需要养成符合自身场景需求的技术落地业务的能力。

开源策略对于某些公司来说,可能是一个好的策略。但是不同公司的业务模式是不一样的,不一定适用所有的公司。方舟健客会结合自身的战略上和业务模式去谨慎评估是不是要推出这种开源行业模型或者数据集。即使是做开源,也会因为业务模式不同,采用不同的开源策略。


刘湘明:您觉得未来,互联网医院的核心壁垒会是什么?

郭陟:互联网医院的核心壁垒就目前还在于是医生的资源和患者数据,这是两个最核心的竞争壁垒。短时间之内也肯定还是非常重要,未来这两个优势也会一定会慢慢转化为智能体依托的差异化算法,最终肯定会形成一个算法壁垒。只是这个周期会比其他行业更漫长一点,需要更多的耐心。

以上为《数字价值观察室·AI落地场景观察》第三期直播的部分内容,完整版请观看《“AI+医疗”加速落地,还需啃下哪些“硬骨头”》。


(本文首发于钛媒体App 作者|唐刚,编辑|华楠)

ad1 webp
ad2 webp
ad1 webp
ad2 webp