本文通过回顾中医临床大数据知识工程学的起源及其40年发展历程,厘清了各研究阶段的重大事件和研究成果,阐述了基于病案的真实世界中医临床研究思路与方法,强调了从数据驱动向数据与知识双驱动模式转换,推动真实世界中医临床研究模式变革与创新的重要性,明确了模式变革与创新的基础是将中医临床病例数据库知识属性化重构,使隐性知识显性化,实现知识的完整表达,构建中医临床病例知识库。以病例数据知识化、知识编码及知识图谱为示例,重点展示了中医临床大数据知识工程的关键技术和核心环节,充分证实了大数据知识工程是真实世界中医临床研究的必由之路。在国家中医药高质量发展战略指引下,未来应培育中医临床研究新质生产力,形成具有新发展理念的中医临床研究新业态,构建大数据知识工程技术平台和中医临床知识仓库,为开展中医临床领域大模型研究提供技术平台和知识资源,促进中医临床智能化和中医药事业高质量发展。
1 中医临床大数据知识工程的起源与发展历程
1.1 前期研究阶段
1.1.1 中医临床人工智能研究(1979—1984年)
20世纪70年代末至80年代中期,李国平院士和中医大师黄绳武,倡导建立中医控制论研究室,开展计算机辨证论治、中医临床专家系统研究,历时5年,研发了中医内科、妇科、儿科等多个临床专科的计算机专家诊疗系统软件,并编撰了相关专著,开创了控制中医学研究的先河。但受限于当时的计算机技术水平和信息标准的缺失而未能得到深化与推广应用,突显了开展中医临床信息管理技术与标准研究的必要性和紧迫性。
1.1.2 中医临床信息管理系统研究(1985—1995年)
本阶段以中医临床信息编码和信息管理技术研究为目标,开展中医病证分类编码技术和中医病案首页中西医双重诊断研究,为国家中医药管理局制定具有中西医疾病分类编码的“中医病案首页”提供依据。在此基础上,研制了中医病案首页信息管理系统、中医病案统计信息管理系统等,并在全国推广应用,编撰了相关专著。
1.2 工程预研究阶段
1.2.1 中医药信息标准体系构建研究(1996—2015年)
本阶段以中医药信息标准制修订研究为目标,完成中医药信息标准体系的顶层设计,编制《中医药信息标准体系表》,并由国家中医药管理局发布。该体系表将信息标准划分为基础标准、技术标准等4个类目和25个分类目,初步建立中医药信息标准体系,为中医临床数据知识化提供标准依据。
1.2.2 临床数据治理及知识关联方法研究(2016—2020年)
在建立中医药信息标准体系的基础上,由多家单位组成研究团队,针对临床数据治理和知识关联方法等关键技术开展临床应用研究,编撰了相关著作,为形成中医临床大数据知识工程研究思路与方法奠定基础。
1.3 工程研究阶段(2021年至今)
本阶段界定了中医临床大数据知识工程的概念和目标,并对“工程”进行总体规划与设计,开展了理论与方法、标准和技术等3大体系构建研究。主要研究进展包括:
图1 真实世界中医临床研究新模式流程
(1)以刘保延提出的真实世界中医临床研究范式为指导,创立了基于大数据知识工程的真实世界中医临床研究新模式。新模式流程见图1。
(2)通过构建中医临床诊疗知识本体,融合中医学、大数据科学和知识工程学等3个学科理论,建立了中医临床大数据知识工程的理论和方法学体系。
(3)以中医临床信息分类与代码标准为依据,研制了《中医临床基本知识编码库》,制定了将中医临床病例数据库进行知识属性化重构,形成中医临床病例知识库的技术规范。
(4)以人工智能自然语言处理技术,研制了基于病案的中医临床病例数据库与知识库自动生成系统,解决了海量病案数据生成病例数据库与知识库的瓶颈问题,完成了中医临床大数据知识工程技术平台的方案设计。
(5)应用大数据知识工程技术方法开展了中医肝病、脾胃病、小儿肾病、名老中医临证经验传承等中医临床大数据知识工程专题研究,探索中医临床精准化诊疗(证、治、效)模型构建和知识图谱绘制的技术方法。
2 基于病案的真实世界中医临床研究思路与方法
2.1 研究思路
以《“十四五”中医药发展规划》为指导,以中医临床精准化诊疗(证、治、效)模型研究为目标,践行真实世界中医临床研究新模式和实施中医临床大数据知识工程,组织开展基于海量病案数据的真实世界中医临床研究。遴选中医临床优势病种,收集整理该病种的原始病案资料,通过数据治理过程,形成中医临床病例数据库与知识库。探索该病种临床知识分布规律及知识关联关系,构建中医临床精准化诊疗模型,以经临床循证研究验证与优化的中医临床诊疗模型为据,制定该优势病种中医临床诊疗指南,反馈应用于指导临床实践,促进中医临床诊疗的高质量发展。
2.2 研究方法
2.2.1 标准操作流程
基于病案的真实世界中医临床研究标准操作流程(SOP)包括原始病案资料收集、数据规范化、数字化、结构化、知识化、模型化及其临床验证与优化和反馈控制等闭环管理环节,其标准操作流程见图2。
图2 基于病案的真实世界中医临床研究标准操作流程
2.2.2 操作规定与要求
(1)遴选中医专科专病。
围绕中医专科优势病种开展基于大数据知识工程的真实世界中医临床研究,对规范诊疗行为、提高诊疗质量具有现实意义。该研究首先遴选中医专科优势病种,依据临床科研设计的纳入标准和排除标准,多元化搜集该病种的原始病案资料,将经过筛选和整理的病案数据录入计算机,构建中医原始病案数据库。
(2)中医病案数据治理。
中医优势病种的病案数据治理,是基于病案的真实世界中医临床研究的基础性工作。首先依据相关标准与研究,分类规范该病种病例数据中的中医药名词术语,使其符合中医临床术语标准的要求;再根据“工程”规范的中医临床信息采集表,设计优势病种中医临床病例报告表(CRF)和中医临床病例数据库结构,对病例数据进行结构化处理,形成优势病种的临床病例数据库(CCDB);以中医临床知识属性分类与代码标准,对CCDB进行知识属性化重构,形成该优势病种的临床病例知识库(CCKB)。
(3)临床病例知识关联与知识建模。
以该优势病种的CCKB为对象,应用知识工程的技术方法,对该知识库中的临床病例知识进行关联分析,挖掘隐含的临床诊疗“事实与规律”,并建立该优势病种具有临床数据支撑的中医临床诊疗(证、治、效)模型(简称“模型A”),为进一步开展该病种诊疗模型临床循证研究奠定基础。
(4)诊疗模型临床循证研究。
采用循证医学的方法,对“模型A”开展临床循证研究,以对其进行验证和优化。依据该优势病种的中医临床病例报告表规范,实时、准确、完整采集其临床诊疗信息;构建该优势病种循证研究的CCDB和CCKB;以该CCKB为对象,进行知识关联分析,建立基于实时规范采集临床病例数据的中医临床诊疗“模型B”。以“模型B”为据,对“模型A”进行验证与优化,形成该优势病种中医临床诊疗“模型C”,再以“模型C”为据,研制该优势病种的中医临床诊疗指南,用于指导临床实践。
2.2.3 中医CCKB构建关键技术示例
中医CCKB是依据中医临床知识编码标准将中医病例数据知识化,并对CCDB进行知识属性化重构而形成的。数据知识化与知识编码是CCKB构建的关键技术,现以某中医医院妇科优势病种“妇人腹痛”临床病案为例:
(1)中医临床诊断数据知识化与编码示例。
①妇人腹痛病-湿热瘀结证的诊断知识结构(图3)。
图3 妇人腹痛病-湿热瘀结证临床诊断知识结构
②妇人腹痛病-湿热瘀结证的诊断数据知识化与知识编码(表1)。
表1 中医临床诊断数据知识化与知识编码示例
(2)中医临床干预数据知识编码及图谱示例。
①中医临床干预数据知识编码示例。
本病例中临床干预是在核心处方“柴枳败酱汤”的基础上进行随证加减,现仅以该核心处方为例进行临床干预知识编码,其随证加减用药的知识编码以此类推。首先对该核心处方中的中药名称进行规范,如“红藤”规范为“大血藤”,“败酱”规范为“败酱草”等,再依据中药临床知识属性分类编码标准对该处方知识进行编码示例(表2)。
表2 柴枳败酱汤知识编码示例
②中医临床干预数据知识图谱示例。
知识图谱是大数据时代最重要的知识表示形式,能够将中医药知识内涵通过数据挖掘、信息处理、知识计量和图形绘制而呈现,已逐渐被应用于中医药领域的智能搜索、深度问答、知识推荐、辅助决策等方面。现以表2中中药处方“柴枳败酱汤”的临床药用知识关联关系绘制图谱来呈现其知识内涵(图4~图6)。
图4 柴枳败酱汤二级知识图谱
图5 柴枳败酱汤三级知识图谱
图6 柴枳败酱汤性味归经图谱
3 中医临床大数据知识工程的临床价值与深化发展
中医临床大数据知识工程将现代大数据、知识工程、人工智能等新兴前沿技术与临床中医学深度融合,是新兴前沿技术与临床中医学的“融合剂”,也是中医临床标准化和信息化双向融合的成功范例,具有高科技、高效能、高质量等临床价值。其一,搭建高效能中医临床研究技术平台。提高中医临床研究效率与质量,是高效能临床中医学科学研究的技术平台。其二,培养高素质复合型人才梯队,组建专业化科研团队,协同开展项目攻关研究,利于高素质复合型人才的培养。其三,推进高质量学科与专科内涵建设,构建中医优势病种精准化“证-治-效”模型,形成中医临床诊疗思维导图,编制中医优势病种诊疗指南。
中医临床大数据知识工程将以培育临床中医学新质生产力为导向,稳步实现中医药科技突破与发展。其一,依托中医临床海量数据构建“临床中医学知识仓库”,为临床研究提供知识资源。其二,应用知识关联分析技术构建精准化中医病证“证-治-效”模型(判别式AI小模型)。其三,以临床中医学知识仓库训练优选的开源大语言模型,构建临床中医学领域大模型(生成式AI大模型)。
4 结论
中医临床大数据知识工程学旨在践行“守正创新,笃行致远”,共促新时代中医药高质量发展。通过深度融合理论,形成了理论体系,制定了技术规范,揭示了“事实与规律”,示范了技术方法。中医临床大数据知识工程是系统工程,需要建立创新型研究范式和多学科协同。展望未来,“临床中医学知识仓库”“判别式AI小模型”“生成式AI大模型”等将为中医临床研究和中医药事业高质量发展做出贡献。
本文作者:孙婷、张盼、宋淑洁、李君、李晓东、沈绍武、肖勇、田双桂、黄缨、毛树松
作者简介:孙婷,湖北中医药大学中医临床学院,博士研究生,研究方向为名老中医经验传承;黄缨(通信作者),湖北中医药大学附属荆州市中医医院,教授,研究方向为名老中医经验传承;毛树松(共同通信作者),湖北省中医院,教授,研究方向为中医药标准化与大数据知识工程研究。
论文全文发表于《科技导报》2024年第21期,原标题为《基于大数据知识工程的真实世界中医临床研究思路与实践》,本文有删减,欢迎订阅查看。
内容为【科技导报】公众号原创,欢迎转载
白名单回复后台「转载」
《科技导报》创刊于1980年,中国科协学术会刊,主要刊登科学前沿和技术热点领域突破性的成果报道、权威性的科学评论、引领性的高端综述,发表促进经济社会发展、完善科技管理、优化科研环境、培育科学文化、促进科技创新和科技成果转化的决策咨询建议。常设栏目有院士卷首语、智库观点、科技评论、热点专题、综述、论文、学术聚焦、科学人文等。