基因测序仪是生命科学研究和产业发展的重要工具。它能够读取和分析基因信息,为基因检测、基因编辑、基因合成等应用提供底层支撑,被称为生命科学领域“光刻机”。近期,由于国际基因测序巨头因美纳(Illumina, Inc.)被商务部列入“不可靠实体清单”,一时引发“行业地震”,国产测序平台有关的议题也被推到风口浪尖。
国内相关科研机构和行业中下游企业用户也面临一个亟待解决的问题:谁能够真正“替代”因美纳?滴水穿石,非一日之工。基因测序仪因其极度复杂、极度集成的结构,从生产出一台“能用”的测序仪到生产出多台稳定“好用”的测序仪,并不是一蹴而就的过程。个中种种,尚需时间以及用户的反复验证。
然而,更换测序平台极有可能对研究工作以及检测工作产生较大影响,因而平台的选择需要综合考量,比对因美纳的成立时间、全线产品线布局以及市场占有率等多种因素,当前国内虽有数十家企业投身基因测序技术研发与设备生产赛道。但从目前来看,总部位于深圳盐田的华大智造作为国内龙头,无论从测序平台的全面性及稳定性、客户群体数量(超过 3000 家)、平台支撑的文章数(超过 10000 篇)、全流程解决方案等多种角度来看,都无疑是最具竞争力的公司。
另外,据华大智造官网介绍公司是“全球唯一同时拥有‘激发光’、‘自发光’和‘不发光’三大测序技术路线的企业”。笔者亦留意到华大智造近期动作频频,在刚刚落幕的 AGBT(基因组生物学技术进展大会)上,华大智造又推出了名为 DNBSEQ-T1+ 的测序仪,24 小时可完成 Tb 级测序,一次可运行一个人的 WGS、WGBS、RNA+meta 及肿瘤 ctDNA 多组学检测。另外,全面拥抱 AI 算法,推出 E25 Flash 生成式 AI 闪速测序仪,最快 2 小时完成 SE50 测序。也侧面能够看到华大智造在激烈竞争格局下,在测序布局上不断审视客户需求、审视产品布局的应对。
本文罗列了部分对因美纳测序平台与华大智造测序平台综合性能进行比对的文章数据,涵盖测序的基础性能、宏基因组测序、古基因组测序、甲基化测序等方向,在这个时间节点,希望能够给各位读者提供参考。
基础性能评价
由生物分子资源设施协会(Association of Biomolecular Resource Facilities,ARBF)主导的 ABRF NGS II 期研究成果发表于Nature Biotechnology(图1A)(Foox et al., 2021)。研究团队基于多个商业化公司的多款测序平台,在多个实验室对同一人类基因组家族、三个单独菌株和十种细菌的宏基因组混合物进行测序,并将各平台数据进行全方位、系统性比较,分析各个测序平台的性能差异和测序质量,以提供真实全面的参考证据。该研究发现在高通量测序仪中,华大智造的多款 DNBSEQ 测序平台(MGISEQ-2000等)提供了最低的测序错误率(图1B)(Jeon et al., 2021)。
详细解读相关链接:
而来自韩国大田的个性化基因组医学研究中心(KRIBB)的研究团队则综合性地比较了华大智造的多款 DNBSEQ 测序平台(MGISEQ-2000/DNBSEQ-T7)与因美纳的 NovaSeq 6000 平台在全基因组测序层面的性能,相关研究成果发表于Genes & Genomics(图1C)(Jeon et al., 2021)。
该研究利用此三平台对来自韩国肺癌患者的正常和肿瘤组织进行测序,并对产生的数据做了平行比较后发现各测序平台在全基因组测序(WGS)中的片段大小分布、基因覆盖率和表达变异检测方面的表现都很相似(图1D,1E),表明了 MGISEQ-2000 和 DNBSEQ-T7 平台的性能表现已经达到了国际领先水平 (Jeon et al., 2021)。
详细解读相关链接:
图1A. 生物分子资源设施协会ARBF所开展研究的发文封面;
图1B. 基于包含DNBSEQ测序平台在内的多款测序仪的测序数据性能表现;
图1C. 韩国某科研团队开展肺癌研究的发文封面;
图1D,1E. 多款测序平台的原始测序数据质量的比较。
由于篇幅因素,在此两项较为详细介绍的案例之外,仍有多项研究表明:华大智造的 DNBSEQ 测序平台在测序质量、覆盖均匀性、GC 覆盖率百分比和变异准确度等方面与因美纳测序平台无明显区别,且可以以更低的成本用于广泛的基因组学研究领域(Chen et al., 2019; Jeon et al., 2023; Kim et al., 2021)。
宏基因组测序
宏基因组高通量测序技术(mNGS)凭借其显著优势,在传染性病原体检测领域的应用日益广泛,正快速从实验室理论研究阶段迈向临床实验室实际应用。
来自天津医科大学总医院呼吸与危重症医学科的研究团队基于不同高通量测序平台开展肺部传染病的诊断工作,相关成果发表于Frontiers in Pharmacology(图2A)(Han et al., 2023)。该前瞻性研究系统性比较了华大智造 DNBSEQ 测序需平台与因美纳测序平台在检测肺部病原体方面的表现 (Han et al., 2023)。研究结果表明这两种测序的诊断灵敏度均明显高于常规检查(分别为82.1% vs. 38.5%,p < 0.001;76.9% vs. 38.5%,p < 0.001)(图2B) (Han et al., 2023)。两平台的灵敏度和特异性无明显差异,且病原体检出率也无明显差异,诊断性能相似,均优于常规检查 (Han et al., 2023)。
而来自中国人民解放军疾病预防控制中心研究团队则将将宏基因组测序应用于鹦鹉热衣原体的人类致命感染诊断中,相关成果发表于BMC Genomics(图2C)(Wang et al., 2021)。该研究同样使用了华大智造 DNBSEQ 测序平台与因美纳测序平台,发现两平台均可快速识别未知感染(图2D)并提供关于抗生素敏感性的信息,但 DNBSEQ 测序平台可产生更多数据,从而提高测序深度和提供更多抗生素敏感性信息 (Wang et al., 2021)。
详细解读相关链接:
在宏基因组的组装上,目前主流方法是第二代短读测序,但第三代长读技术的进步提供了克服短读测序局限性的机会。多篇系统性研究表明混合组装是一种整合短读和长读优势的策略,而短读长数据来源于华大智造 DNBSEQ 测序平台或因美纳测序平台并不会产生显著差异 (Meslier et al., 2022; Zhang et al., 2023)。
最近,中国疾病预防控制中心性病艾滋病预防控制中心病毒免疫室使用华大智造 MGISEQ-2000 高通量测序仪和华大序风 CycloneSEQ-WT02 纳米孔测序仪,对HIV病毒近全长扩增子进行了测序分析,鉴定出新的 HIV-1CRF 分枝 CRF172 0755,并提供了该重组型的详细信息(图2E,2F)(Li et al., 2024)。
详细解读相关链接:
图2A.肺部传染病诊断研究的文章信息;
图2B.基于两种测序平台的宏基因组测序诊断结果与常规检查结果对比;
图2C.鹦鹉热诊断研究的文章信息;
图2D.基于DNBSEQ测序平台对鹦鹉热感染患者样本开展mNGS研究检测到的前十大物种;
图2E. 基于DNBSEQ和CycloneSEQ测序平台开展HIV全长测序文章信息;
图2F. HIV-1CRF分枝CRF172 0755近全长基因组示意图。
古基因组测序
随着测序成本的下降和准确度的提高,高通量测序技术在古基因组研究中的应用愈发普及。目前,该技术已被广泛用于构建古人、类人动物、其他动植物以及真菌的基因组。与此同时,群体基因组和宏基因组研究也在古基因组领域兴起,部分研究更是拓展至转录组和表观遗传领域。
由于长时间的水解、氧化及环境微生物降解作用,古 DNA 经常处于严重降解状态,且往往存在于复杂的富含外源 DNA 污染的环境中,给研究带来了巨大挑战。
华大基因联合丹麦哥本哈根大学、丹麦技术大学等组成的研究团队综合性比较了华大智造 DNBSEQ 测序平台和因美纳测序平台在古基因组研究中的性能表现,相关成果发表于GIGA Science(图3A)(Mak et al., 2017) 。在这项研究中,研究人员分别使用华大智造 DNBSEQ 和因美纳 HiSeq 2500 平台,对 91-14000 年前的 8 个古老大型犬科动物的 DNA 样本进行测序并对测序性能和数据质量进行比较 (Mak et al., 2017) 。研究结果表明,两个测序平台的数据表现基本相当 (图3B) ,DNBSEQ 测序平台在古基因组测序领域极具潜力,是一种行之有效且价值颇高的潜在替代平台,值得利用它对降解 DNA 展开进一步探索 (Mak et al., 2017) 。
详细解读相关链接:
另一项研究中,复旦大学的研究团队联合厦门大学的研究团队首次使用了公元前 1750 年到公元 60 年左右的四个古代中国人骨骼样本,系统性比较了华大智造 MGISEQ-2000 和 Illumina X-Ten 平台在古代人类 DNA 测序中的性能,相关成果发表于Frontiers in Genetics(图3C)(Zhu et al., 2021) 。研究成果表明,MGISEQ-2000 和 X-Ten 具有相当的性能,均可以作为古基因组学研究的潜在选择测序平台 (图3D)(Zhu et al., 2021) 。
详细解读相关链接:
图3A.评估DNBNSEQ测序平台在考古研究中的性能的文章信息;
图3B.考古样本利用两种测序平台所获数据总结;
图3C.文少卿团队相关研究的文章信息;
图3D.MGISEQ-2000与X-Ten在100kb阅读框中测序覆盖率。
甲基化测序
高通量测序技术凭借输出量高、准确度高的优势,已被大规模用于识别与恶性肿瘤相关的异常 DNA 甲基化,在辅助诊断、预后预测和病情监测等临床应用方面发挥重要作用。
来自鹍远生物的研究团队对比了华大智造 MGISEQ-2000 测序平台和因美纳 NovaSeq 6000 测序平台用于亚硫酸氢盐靶向测序的性能,相关研究成果发表于Clinical Epigenetics(图4A)(Sun et al., 2023) 。结果表明,MGISEQ-2000 展现出与 NovaSeq6000 相似的测序质量、一致的甲基化水平、相当的癌症信号检测能力和准确的临床诊断结果,说明 MGISEQ-2000 可应用于临床检测 DNA 甲基化变化,特别是 cfDNA 甲基化检测 (图4B)(Sun et al., 2023) 。
图4A.评估DNBNSEQ测序平台在靶向甲基化测序中的性能的文章信息;
图4B. 跨平台甲基化测序对PDAC患者的预测分数。
详细解读相关链接:
总结
整体来看,来自全球各地的多个研究团队,基于不同的应用场景发表的高水平同行评审研究论文表明:华大智造 DNBSEQ 测序平台在 10 年的迭代升级中,经过反复验证,其 DNBSEQ 测序平台性能与因美纳测序平台具备可比性,在部分指标有所领先。
论文也集中提及了一个观点,华大智造错误率更低的原因,是由于华大智造 DNBSEQ 测序技术测序原理的优势——即具有高准确性,低重复序列率以及低标签跳跃等重要特性。另外,“长读长+短读长”平台结合也是华大智造现有测序平台的差异优势点。
参考文献:
Chen, J., Li, X., Zhong, H., Meng, Y., and Du, H. (2019). Systematic comparison of germline variant calling pipelines cross multiple next-generation sequencers. Scientific Reports 9.
Foox, J., Tighe, S.W., Nicolet, C.M., Zook, J.M., Byrska-Bishop, M., Clarke, W.E., Khayat, M.M., Mahmoud, M., Laaguiby, P.K., Herbert, Z.T., et al. (2021). Performance assessment of DNA sequencing platforms in the ABRF Next-Generation Sequencing Study. Nature Biotechnology 39, 1129-1140.
Han, S., Zhao, Z., Yang, L., Huang, J., Wang, Y., and Feng, J. (2023). The performance of metagenomic next-generation sequencing in diagnosing pulmonary infectious diseases using authentic clinical specimens: The Illumina platform versus the Beijing Genomics Institute platform. Frontiers in Pharmacology 14.
Jeon, M.-S., Jeong, D.M., Doh, H., Kang, H.A., Jung, H., and Eyun, S.-i. (2023). A practical comparison of the next-generation sequencing platform and assemblers using yeast genome. Life Science Alliance 6.
Jeon, S.A., Park, J.L., Park, S.-J., Kim, J.H., Goh, S.-H., Han, J.-Y., and Kim, S.-Y. (2021). Comparison between MGI and Illumina sequencing platforms for whole genome sequencing. Genes & Genomics 43, 713-724.
Kim, H.-M., Jeon, S., Chung, O., Jun, J.H., Kim, H.-S., Blazyte, A., Lee, H.-Y., Yu, Y., Cho, Y.S., Bolser, D.M., et al. (2021). Comparative analysis of 7 short-read sequencing platforms using the Korean Reference Genome: MGI and Illumina sequencing benchmark for whole-genome sequencing. GigaScience 10.
Li, H., Feng, Y., Xu, Y., Li, T., Li, Q., Lin, W., Ni, W., Yang, J., Mao, W., Wang, Z., et al. (2024). Characterization of a novel HIV-1 second-generation circulating recombinant form (CRF172_0755) among men who have sex with men in China. Journal of Infection 89.
Mak, S.S.T., Gopalakrishnan, S., Carøe, C., Geng, C., Liu, S., Sinding, M.-H.S., Kuderna, L.F.K., Zhang, W., Fu, S., Vieira, F.G., et al. (2017). Comparative performance of the BGISEQ-500 vs Illumina HiSeq2500 sequencing platforms for palaeogenomic sequencing. GigaScience 6.
Meslier, V., Quinquis, B., Da Silva, K., Plaza Oñate, F., Pons, N., Roume, H., Podar, M., and Almeida, M. (2022). Benchmarking second and third-generation sequencing platforms for microbial metagenomics. Scientific Data 9.
Sun, J., Su, M., Ma, J., Xu, M., Ma, C., Li, W., Liu, R., He, Q., and Su, Z. (2023). Cross-platform comparisons for targeted bisulfite sequencing of MGISEQ-2000 and NovaSeq6000. Clinical Epigenetics 15.
Wang, K., Liu, X., Liu, H., Li, P., Lin, Y., Yin, D., Yang, L., Li, J., Li, S., Jia, L., et al. (2021). Metagenomic diagnosis of severe psittacosis using multiple sequencing platforms. BMC Genomics 22.
Zhang, Z., Yang, C., Veldsman, W.P., Fang, X., and Zhang, L. (2023). Benchmarking genome assembly methods on metagenomic sequencing data. Briefings in Bioinformatics 24.
Zhu, K., Du, P., Xiong, J., Ren, X., Sun, C., Tao, Y., Ding, Y., Xu, Y., Meng, H., Wang, C.-C., et al. (2021). Comparative Performance of the MGISEQ-2000 and Illumina X-Ten Sequencing Platforms for Paleogenomics. Frontiers in Genetics 12.