卷赢大模型训练成本之后,DeepSeek正在重塑全球AI竞争格局。

微信、飞书、百度等上百家企业一个赛一个地宣布接入DeepSeek,表面喧腾之下,实则是更多应用场景的进一步落地。

随着各行各业的领导者全面拥抱AI,整个社会以及我们每个人其实都正在接入AI。

不过,作为AI领域最被看好,且一直不缺讨论度的AI医疗,目前始终存在“缺少领头羊”的局面。

原因不外乎三点:

  • AI医疗场景细分化程度过高。从中医到影像识别,从陪诊就医到药物研发,落地的应用很多,但真正罕有能够出圈的;
  • 缺乏统一标准来评估医疗AI大模型的能力,导致缺失明确的发展和改进方向,且试错成本高企;
  • 行业特征所限,AI医疗严格受到伦理等客观因素制约,厂商们面临严格的权限和资格审查;

然而,也是在这样的环境下,杭州的一家科技公司“智诊科技”所推出的产品——好伴AI,上线了一些令人眼前一亮的医疗AI功能和差异化技术,获得了人们的目光。

更重要的是,与DeepSeek登陆App Store人人可用一样,好伴AI现在也以APP的形态,人人可体验。

没病纯保健,可以让好伴AI帮看看——

比如当你拿到了一份最新的体检报告,里面的专业名词让你一看一个不吱声,没关系,上传一下它就能帮你解读。



有症状想先问问——

它能结合真实医生的临床经验、医学手记、科研论文,给三甲医院专家建立了数字分身,不用挤破头挂号就能在家问诊。



由于观察到用户增长速度很快,我们也决定对这个AI进行一次深度测评。

一手实测「好伴AI」

目前这款产品有网页版APP版,下面我们直接用APP实测。

首页打开是酱紫的,一眼就能看到几个核心功能:



实测项目一:解读检测单、体检报告

这第一关,我们直接从最常见的检测单/体检报告解读开启。

只需一个上传多图的动作,两张令人懵逼的检测单就秒秒钟被解读出来了。

(考虑到个人对准确性的要求,一开始就打开了深度慢思考)



仔细看,在一步步思考后,好伴AI最终做出了两个主要判断:

  • 胆红素水平升高;
  • 对于乳腺结节,右侧的低回声结节(BI-RADS 3类)和左侧的无回声结节(BI-RADS 2类)都属于良性可能性较高的类型;

而这也都和检测单原版结论完全对上了。

比较贴心的是,回答过程中它还和线下医生一样,不仅明确了复查时间,还会提醒各种注意事项。



看来小小几张检测单是难不倒它了。

那么,让难度再次升级,直接扔给它一份辣么长的体检报告PDF呢?(里面有各种检测单、超声图、心电图等)



点进右上角的「体检报告解读」,可以看到有两种上传方式:

一种是直接传PDF文件,另一种是复制粘贴报告链接。



这里要插一嘴,为了真实考验好伴AI的能力,我们提前将报告里的结论页都删去了

实测过程中,它先花了大约两分钟解析PDF,然后会要求你回答一些个人健康状况(20道题),再之后你就可以和AI医生交流各项异常指标了。



整体测下来,大约10分钟内就可以获得一份详尽报告。挨个比对其结果和原版结论,竟然也都完全吻合。

对了,眼尖的朋友想必也发现这里还有一个历史报告记录,作用就是收集整理你的历次体检报告。

如此一来,以后想要随时查看自己的健康史也就更方便了。

实测项目二:线上找三甲医生“数字分身”问诊

接下来,我们再来测一下好伴AI的另一大亮点——医学专家分身系统

一眼望去,光看头衔就知道这群专家线下的“号”很难挂了。

王利权(浙大医学附属二院/妇产科主任医师)、邬玲仟(中南大学湘雅医院/妇产科主任医师)、张炜(复旦大学附属妇产科医院/主任医师)……



等等,先解决一个好奇,这些数字分身从何而来呢?

原来,这些是通过融合真实医生的临床经验、医学手记、科研论文、授课视频等个人独有的资料,利用AI技术打造而来。

像王利权医生的“数字分身”,不仅掌握了他40余篇论文和近400个视频中的专业知识,还能模拟他的诊疗思路和沟通风格,从而为用户提供高度个性化的建议(如孕期健康管理、唐筛报告解读)。

言归正传,每一个数字分身点进去,其主页都有各自擅长领域的介绍。



鉴于王医生擅长妊娠并发症等,我们直接咨询一个最近刚上过热搜的案例。



只见“王医生”慢慢思考之后,非常细致地列出了这位高危产妇在手术过程中需要注意的点。



而且深扒其思考过程,也终于解答了当时看热搜引发的好奇:

为啥要让胎儿在胎膜囊未破的情况下出生?(原来是为了保护早产儿)



整体测试下来,这个功能不仅解答确实专业,而且相当利国利民,毕竟这就意味着最顶尖的医疗专家资源,每个人都能无差别共享,还是7x24小时响应那种。

实测项目三:全科医学咨询OK吗?

当然,除了找专家处理复杂问题,医疗场景中更日常普遍的还是“全科门诊和咨询”。

但整体实用下来,好伴AI效果不错,或许是由于它背后是730亿参数的全科医学通用大语言模型WiseDiag-Z1,因此我们可以像对话一样,让其帮忙提供症状分析、用药咨询以及个性化健康指导。

比如身为打工人,一旦觉得身体疲劳了,我们就总是想问:

难道是气血不足了?(笑死,这个问题还经常冲上热搜)

随机找一位全科医学专家,问问他有没有哪些判断小技巧。



结果,他直接从中医角度给了一套自检小连招,看脸色、查舌头、观眼睛、看头发,这就马上get!

此外,还有从现代医学角度的“症状”诊断:



很好,是谁全中了我不说,而且建议的第一条还是不要熬夜。

emmm……发出皇后娘娘的委屈,毕竟实测的时候我就在熬夜:



不过,虽然建议咱确实做不到,但情绪价值也给拉满了——AI还能够以非常温柔、积极的姿态关心俺们……

实测项目四:上下文和长记忆能力如何?

作为一个线上医疗产品,必须要具备的是能长“陪伴”,能够对用户过往问诊记录有记忆,不必每次都重新表达。

所以我们也测试了一下,比如模糊记得,很早之前和它聊过肝功能的问题,刚好随机抽查一下……

没想到,它准确回忆起上次聊到还是6个月前,并且建议近期去复查。



再来一次,前一阵有落枕的毛病,到现在还没缓解,于是又问了一遍。



从其思考过程来看,它明确意识到了用户之前就有落枕这一点:

已知前一天有落枕史……

这种记忆和上下文联想的能力,基本上能够实现长期健康追踪与个性化服务了。

当然,出色的产品体验背后,一定是基于技术上的领先。

当我们把体验反馈给好伴AI的出品团队时,他们也分享了背后的技术关键。

技术原理=730亿参数医学大模型+推理

简单说无非就是两点,一是基座模型,另一方面在则是产品化——

模型上,团队精心训练了全学科医学基座大模型WiseDiag-Z1;产品化上,则针对市面上同类医疗AI进行了全方位改进。

先说模型训练。

第一步,垂直领域要想训练出真正有用的AI模型,大量高质量数据必不可少。

于是,团队给模型“喂”了超3万亿token的专业医学数据,包括权威教材(如《内科学》、《妇产科学》)、最新临床指南(如NCCN、中华医学会系列)、50万篇医学论文及真实病例库。

打好地基之后,接下来的关键是如何处理这些素材。

这里,团队祭出了一项关键法宝——医学编码模型(Med-Embedding)。与普通向量编码模型不同,它能通过捕捉医学术语的临床意义,将这些信息转化为高维向量,确保AI在诊断时不会混淆关键细节。

通俗地说,有些表达在日常语言中看似区别不大,但到了医学场景,往往失之毫厘谬以千里。

就像“发烧38度三天”和“反复低热”,前者更接近急性感染的向量,而后者则是慢性。

这种关键但又细微的差别,往往普通向量编码模型无法准确区分,不过医学编码模型会结合医学知识库和临床背景,对术语进行精准编码。

这还不算完,训练过程中,团队还邀请了临床医生深度参与

通过监督微调(SFT)和直接偏好优化(DPO),人类医生的诊疗思考逻辑(如鉴别诊断优先级、风险权衡等)也被引入模型。

最终,团队为好伴AI自研出了全学科医学基座大模型WiseDiag-Z1,拥有730亿参数,支持32K上下文长度。

它采用了独特的多层次推理机制,能够像专家医生一样,进行深入细致的分析思考和反复权衡;且在病因分析、鉴别诊断、制定治疗方案等关键环节,它能模拟专家医生层层思考,直至找到最优解。



而基于这一具备推理能力的强大专业模型,团队更是在打磨具体产品上下足了功夫。

分析目前市面上的医疗AI,无外乎有以下几种形态:

  • 在线问诊+药品配送,AI基于预设规则来诊疗一些常见病;
  • 医学知识科普+轻问诊,AI局限于症状自查表;
  • 医院挂号与慢病管理,AI以信息匹配为主;

但不管是哪种形态,都有些共同的缺点:1)首先还是技术不够成熟,大多数仍采用非推理式的模型,无法处理复杂医学推理(鉴别诊断能力差);2)顶尖医学专家供给有限,无法提供大规模服务;3)更偏向通用,无法实现个性化服务,尤其在个人身体情况本身千差万别的情况下。

针对这些竞品的不足之处,好伴AI逐渐走出了自己的差异化特征:

技术层面,730亿参数WiseDiag-Z1大模型+医学编码模型,能够支持多模态医学数据解析。

举个例子,以川崎病皮疹为例,由于传统医疗AI依赖关键词匹配,因此很容易将它误判为普通过敏,但实际上它是一种以全身血管炎为主要病理改变的急性发热性疾病。

服务方面,借助三甲医院顶尖医生的数字分身,AI诊疗也变得更加专业化、个性化了,真·人均三甲。

最重要的是,借助多层记忆存储+动态知识库(1.2万种疾病),跨周期健康追踪也不在话下。

正如实测部分所展示的,它不仅能帮你回忆起一些旧诊疗记录,还能及时比对动态知识库,快速锁定潜在风险。

事实上,就在上周智诊科技连开几场发布会,一口气发布了三款专业模型:

  • WiseDiag-Z1,全科医学通用大语言模型标准版;
  • WiseDiag-Z1 Thinking,深度推理增强版,适合多步骤复杂场景;
  • WiseDiag-Z1 Lite,量化版,比Z1响应速度更快、更便宜。

冉冉升起的明星医疗AI

文章最开始我们有说了,不论是智诊还是好伴AI,都在越来越破圈、被热议,被视为宝藏杭州冉冉升起的明星。

但实际上,不论是技术还是产品,都离不开智诊科技创办之日就对优质医疗普惠化的坚定追寻。

在中国乃至全世界,都存在着医疗资源分布不均、优质专家稀缺这一痛点。

与之形成鲜明对比的是,每个人都渴望有一个随叫随到的专家级私人医生。

现在,好伴AI做到了。

它没有以“医生助手”的形态示人,而是直接触达普通用户,这种做法不仅最奥卡姆剃刀,也最大程度满足了普通人对医疗资源的渴求。

而且不仅是从无到有,具体到其中的各项功能,也是个个直戳人们的内心。

人们认可专家的名号,更青睐于让专家给自己坐诊,好伴AI就直接把专家复刻成数字人;

人们希望AI助手能够更懂自己,动态掌握自己长期的健康状况,好伴AI就加入了长期记忆;

人们希望专家不仅能够提供实质的帮助,态度上也要友好亲和,好伴AI就给人们输出情绪价值……

作为一款APP,作为24小时在线的“口袋专家”,好伴AI精准地狙击了人们的痛点,架起了医疗大模型和普通用户之间的桥梁,让人们必装的APP又多了一个。

目光上升到宏观层面,好伴AI也实打实地降了低就医门槛。尤其对一些落后偏远的不发达地区来说,这一工具对避免延误诊疗至关重要。

另一方面,好伴AI对医生来说也是一种极大解放。通过上面提到的专家分身系统,他们的宝贵临床经验被转化成了可复用的数字资产。如此一来,这群人也能更加专注疑难杂症,从而最大限度发挥智力资源。

道虽远,行则将至,虽然面临着诸多困难和不确定性,但好伴AI已然在AI+医疗领域披荆斩棘,开辟出了新的道路。

虽然成立还不到两年(2023年6月),但从其一路问鼎全球最强医疗AI模型可以窥见,它可能会成为现阶段发展最快、应用价值最高的医疗AI之一。

网页已经就绪,APP也能公开下载,实力如何,可以自己上手试试了~

网页端(APP端需自行下载好伴AI):
https://chat.wisediag.com

ad1 webp
ad2 webp
ad1 webp
ad2 webp