大型队列：应以医学研究的国之重器来打造

本文转载自“临床研究与循证医学”公众号，感谢授权。

队列可用于研究，但本身不是研究，队列只是一群人及其不同时点上信息的集合。队列是一个综合研究平台，既可用于临床医学和公共卫生研究，也可用于基础医学研究。

队列可用来探索的科学问题的多少取决于其收集的变量的多少，研究结果的科学性取决于其收集的信息的完整性、一致性和准确性的高低，研究成果的多少取决于其数据公开、共享的程度，成败取决于其长期稳定的投入和运行机制。

大型人群队列对医学研究太重要了，应以国之重器的理念和规格来打造。

生物医学研究可分为实验室研究和人群研究。

生物医学实验室研究是以动物、细胞、分子等为研究对象的科学探索，是脱离整体的人的研究，是在实验室里进行的。而人群研究则是以整体的人为研究对象，是在实验室之外的人群现场进行的。医学人群研究主要包括临床研究和公共卫生研究。

实验室研究是关于生命本质、机制、机理的基础医学研究，是医学实践新理论、新方法的重要源泉。基础研究提供的是理论可能性，需通过转化研究和（在人群里的）临床试验，最终才能形成医学实践可用的方法和措施。

可见，基础研究与人群研究是相辅相成、相互依赖的，缺一不可。没有强大的基础研究，人群研究会如无源之水；没有强大的人群研究，基础研究会如无的之矢。两种境况下医学都将是一个不健康的跛子。

而且，人类健康至少50%是由生活方式、环境和社会等非生物因素决定的，这些因素只能通过人群研究来认识，也只能通过非生物途径来解决[1]。

在基础研究方面，在大学和研究所现有的各种生物医学实验室基础上，我国建立了国家实验室和国家重点实验室，组成了我国生物医学研究的重要平台。

但是，我国医学人群研究的重要平台在哪里呢？国家医学中心，尤其是国家临床医学研究中心，是近期我国在医学人群研究方面的重要平台，而大型医学人群队列则是这个平台不可或缺的组成部分。

所谓队列，就是具有一定特征的一群人，以及针对这个人群里所有个体所收集的基线和随访信息。

传统的队列主要用来研究疾病的发病率、病死率和死亡率，疾病的病因和危险因素，疾病的预后及其决定因素。

由于组学的出现和医疗机构常规数据的利用，可收集的信息量远远超越了传统队列，因此现代队列几乎可用来探索与医学实践相关的所有问题，绝非仅仅是寻找药物靶点和精准医学，更包括范围广阔的机制研究（如疾病的基因和生物标记物）、临床研究（如疾病的诊断以及临床治疗的真实世界疗效和副作用）、公共卫生研究（如卫生经济学和医疗公平性），以及医疗卫生体系、政策和管理方面的研究，等等。此外，队列还可以用作临床试验的平台，用来招募和随访病人[2]。

以国家实验室的概念来看，大型医学人群队列就是一个国家医学人群研究的综合平台，其作用等同于一个国家实验室。至今已投资逾37亿英镑的英国UK Biobank，以及美国百万人的All of US精准医学队列，是国际上大型人群队列的典范，都是以医学研究国之重器的理念和规格来投入和打造的。

在过去12年里，UK Biobank的数据已为来自世界各地的3万多个研究团队所利用，并产生了逾10 000篇科学论文，其投资规模和研究产出绝不小于一个国家实验室[3]。大型人群研究队列的重要性和战略地位可见一斑。

最初，队列研究不过是流行病学小圈子的内部游戏。1948年开始的弗明汉心脏研究，对美国弗明汉镇的五千多人进行了长达70多年的追踪随访，揭示了冠心病的主要危险因素。1951年启动的英国医生研究，对英国四万多名医生进行了长达50年的观察，确立了吸烟和肺癌的关系。这两个研究分别是由美国哈佛大学和英国牛津大学的流行病学家发起的。

21世纪以来，随着组学、计算机、可穿戴设备和人工智能的发展，更多学者看到了人群队列在医学研究中的作用，并逐步加入了建设人群队列的行列。

2004年在我国启动的50万人大型自然人群队列——中国慢性病前瞻性研究（英文简称CKB）——是由北京大学流行病学家李立明教授领衔建立的[4]，2006年启动的英国UK Biobank仍然是由一群流行病学和医学统计学家发起的，而2016年启动的美国All of US精准医学队列的初衷则是希望通过人群基因组学研究达到精准诊断和精准治疗的目的。基础医学科学家对人群队列的重视说明了队列对基础研究的重要性。另外，由于大量数据储存和分析的需要，人群队列也开始进入计算机和人工智能专家的视野。

然而，人群队列的最早玩家是流行病学和医学统计学家，在精准医学和人工智能出现以前，关于队列的建设、分析和利用，他们已发展了一整套完善的理论和方法。

组学的贡献在于提供了大量全新的生物医学信息的测量方法，为队列研究提供了全新的研究方向；可穿戴设备则提供了连续测量生物信息的可能性，增加了同一变量的时间维度。此外，计算机使得储存和分析巨量数据成为可能，而人工智能则在传统的统计学之外提出了全新的数据分析方法，尤其适用于基因、图像和多模态等复杂数据的处理和分析。对于队列建设来说，这些贡献无疑是革命性的。

国际上医学人群队列研究正在进入一个蓬勃发展的新时期。这就不难理解近些年人群队列在我国如春笋般兴起的局势。

与国家实验室建设一样，大型医学人群队列的建设和利用有其独特的内在规律。

首先，一个队列要求其个体成员具有共同的特征（如自然人或具有某种疾病的人）。其次，一个完整的队列要求对其所有个体成员进行有关基线信息的测量和收集，以及对所有个体成员进行追踪随访、收集结局信息。

因此，将人群性质不同的队列合并，或者将收集了不同变量信息的队列合并，并不能形成一个更大的队列。

例如，将一个自然人群队列与一个疾病队列合并，并不是一个更大的自然人群队列，也不是一个更大的疾病队列，本质上它们仍然是两个不同性质的队列，各自只能用来做不同的研究。

另外，一个百万人的队列，假如在心脏病问题上只收集了一万人的信息（大队列建设也往往会这么做），那么在进行有关心脏病的研究时，这个队列的有效人数是一万，而不是一百万。

队列可用于研究，但本身不是研究，只是一群人及其信息的集合。因此，大型队列的另一个特征是：研究目的越模糊，则队列的研究潜力就越大。换言之，一个队列收集的信息越“盲目”、越广泛，可研究的问题就越广泛，潜力就越大。因此，没有具体研究问题的“盲目”应该是大型队列建设所遵循的原则：只管耕耘，不问收获——只管收集数据，不管用来做什么具体的研究，因为大型队列的收获取决于它的开放和共享。因此，公共资源支持的人群队列数据都应该公开共享，让尽可能多的研究者利用它们进行科学研究。

中小型队列也应该遵循这一原则，只是收集数据的范围比较小，可研究的课题比较局限。否则，就不应该是建设一个队列，而是做一个具有明确研究问题的研究，这类研究就叫做队列研究。

当然，如果一个队列一开始就有几个明确的重要研究问题来回答，这固然好，也应该鼓励，尤其是那些中小型、不开放共享的队列。所谓具体，就是研究问题的PICOS（研究对象、暴露或干预、对照的暴露或干预、随访结局、研究场景）要具体、清晰、明确，而不是泛泛地讲寻找药物靶点或进行精准医学、临床或心血管病研究等。

一般来讲，队列建设还会收集很多这几个问题之外的信息，以增加这个队列用来回答其他研究问题的潜在作用。相比，那些没有具体研究问题、也不公开共享的队列则可能最终成为盲目的建设。

建设队列还有一个普遍的误区，就是队列越大越好。因此，队列建设者都在争先建设更大的队列。然而，医学研究有一个悖论：效应越大，需要的样本量则越小，对研究设计的要求也越松。

例如，包扎止血、晶状体替换、断肢再植，治疗几个人就足以说明问题，连对照组都不需要；抗生素治疗细菌性肺炎，几百人的对照试验足以；降压药十年内可在100个服药者中预防3例心脑血管事件，则需要几千人的随机对照试验。比降压药效果更小的治疗可能需要上万人的研究，那么需要几十万甚至上百万人的研究，有关效应将会小到什么程度？是否具有医学实践的真实价值？是值得拷问的。

那么，为什么还需要建立百万人的队列呢？原因是，即使是百万人的队列，对于一个基于这个队列的具体研究，符合研究纳入标准的或亚组分析里个体数目经常会远远小于百万，甚至只有几百或几千。建设百万人的队列，目的就是为了满足绝大部分医学人群研究所需要的样本量。

对于罕见病的研究，可能需要很大的队列。但是，对于那些万分之一甚至更低频率的罕见病来说，即使百万人的队列也不够用。我们是否应该为了几个罕见病而建立一个巨大的队列？这本质上是一个成本效益问题，而不是一个科学问题。对于绝大部分医学研究来说，百万人的队列已经足够大了，虽然百万也只是一个方便的数字，并非严谨的科学推算的结果。百万人以上队列的价值值得商榷。更何况，队列是可以不断累积、扩展的，不必要一上来就十分雄心勃勃。

队列的大小固然重要，但一个队列的好坏，是否有用，关键还在于收集的信息的范围及其完整性、一致性和准确性。招募研究对象毕竟比较容易，而有些信息的测量则可能十分困难或十分昂贵。比如，招募100万人参与研究，与这100万人的全基因测序、MRI检查或几十年的随访相比，其难度简直不值一提。而且，在资源一定的情况下，队列的大小与数据的质量成反比，不可一味地追求大。

综上所述，用举国之力，建立一个百万的自然人群队列，创造稳定、持久的运行机制，围绕常见疾病、针对队列内所有成员、收集尽可能多的数据（如组学、表型、环境、生活方式、临床检查、治疗、费用、随访结局等因素），保证数据的质量和共享，这个队列将会成为我国医学人群研究的重要平台。

大型人群队列对医学研究太重要了，应以国之重器的理念和规格来打造。

几句画外音。临床有个鄙视链，科研圈也有。分子和细胞研究是科研圈鄙视链的顶端，系统综述和Meta分析又被搁在原始人群研究之下。21世纪，人群队列与分子生物学走到了一起，乌鸡变成了金凤凰，也成了对一些科研偏见的否定。

另外，从现有研究结果和事实中发现新的规律，可能是更艰难的科学创造。牛顿的万有引力定律、达尔文的进化论，以及孟德尔的遗传分离率，都是在他人研究基础上的总结、抽象和升华，不是从某项具体研究中得出的结论。系统综述和Meta分析也意在如此，意义不能说不大，对研究者的要求不能说不高。

参考资料：

2. Nickolls BJ, et al. Randomised trials conducted using cohorts: a scoping review, at: https://doi.org/10.1136/bmjopen-2023-075601

3. UK Biobank newsletter2023/24, at: http//:www.ukbiobank.ac.uk

4. 中国慢性病前瞻性研究 (China Kadoorie Biobank, CKB), at: https://ckbiobank.pku.edu.cn/xmgk/xmjj.htm