编辑丨王多鱼
排版丨水成文
最近电视剧《棋士》热播,围棋的很多专业术语被大众所熟知,比如 “先手棋”。 所谓 “ 先手 ” ,便是下棋时迫使对方必须回应的关键落子,拥有先手,往往能抢占棋局主动权, 是致胜的关键 。 在中美科技博弈的棋局里,我们也看到了这样的一幕。
2025 年 4 月 2 日,美国国立卫生研究院(NIH)发布公告,明确禁止“受关注国家”机构访问 NIH “受控访问数据存储库及其相关数据”。在“受关注国家”中,中国(包括香港和澳门)、俄罗斯等赫然在列。
这一蛮横举措,瞬间将中美科技领域的博弈再度推至风口浪尖,在生物科研领域激起巨浪。一场围绕数据主权与科研发展的激烈较量,拉开帷幕。
数据封锁:难以阻挡中国科研步伐
大家都知道,美国国家生物技术信息中心(NCBI)旗下,诸如全球最大的核酸序列数据库(GenBank)、基因表达数据库(GEO)、癌症基因组图谱(TCGA)等,在行业内被视作核心资源,是全球科研的“基础设施”,支撑着世界各地科研人员开展研究工作。
相关数据库的影响情况
如今,美国一纸禁令,直接把这些数据库变成了中美科技博弈的“新战场”。对我们国家的科研人员来说,绝非“访问受限”这么简单。众多依赖国际数据库开展的科研课题,可能面临数据断供的风险。
另外,这些数据库不仅仅是存储数据,更是全球生物信息和生命科学领域极为重要的学术交流平台,也将对中国科研人员与国际同行的交流合作产生一定影响。
再往深了看,这场“数据封锁”背后,实质是一场激烈的“科学数据主权”争夺战。美国这么做,就是想牢牢抓住生物科技标准制定的话语权,在未来生物经济竞争中占据优势。
但是,以上种种均无法阻断我国科研的步伐。这是因为,我国已建成位于北京的国家生物信息中心(NGDC)和位于深圳的国家基因库(CNGB)。从基础数据存储到前沿科研应用,二者一南一北,相辅相成,为我国生物信息数据的交汇与共享,铸就了坚实的根基。
未雨绸缪:一场长达十年的精心“布局”
早在 2011 年,当大多数人还未意识到数据主权的重要性时,国家四部委就高瞻远瞩,联合批复建设深圳国家基因库(CNGB)。这一极具前瞻性的决策,堪称我国在生物科技领域落下的一步“先手棋”,为生物科技的长远发展打下基础。
如今,深圳国家基因库通过建立自主可控的数据资源共享平台,已支撑全球 642 个单位机构超过 17PB 数据的开放共享需求,覆盖 202 个国家和地区。深圳国家基因库可存储不同生物的基因样本超过 1000 万份,其基因样品保存规模、存储量和可访问数据量均为全球第一,支撑全球 600 多家单位数据汇交和共享。
在国际标准认证方面,深圳国家基因库是国内首个荣获 CoreTrustSeal 认证的数据库,并且成功跻身世界数据系统(WDS)核心成员之列。这一成就不仅标志着 CNGB 在数据管理和质量保障方面达到了国际顶尖水平,更意味着中国在生物数据领域开始与国际先进水平并驾齐驱。
在技术层面,深圳国家基因库独创了“两库一平台”架构,即生物样本库、生物信息库、数字化平台。这一创新架构实现了从样本采集到数据分析的全链条国产化,彻底摆脱了对国外技术的依赖,让中国在生物数据处理的各个环节都拥有了自主可控的核心技术。
携手努力:打造“不断供”科研生态
在中美“数据脱钩”的大背景下,美国数据封锁的阴云密布,给全球科研合作与交流带来了诸多阻碍。但令人欣慰的是,深圳国家基因库凭借在“数据资源自主性”与“科研成果发表”方面的探索,正努力成为全球科研的“新支点”。
在数据资源自主性上,深圳国家基因库积极构建“不断供”的科研“底座”,定期同步 NCBI、EBI 等国际数据库的公开数据,“备份”关键科研资源。在数据维度上,将文献数据、样本数据、基因数据、变异数据等多种数据打通,开放使用,互联互通。在检索方面,CNGB 支持常规关键词搜索与 30 余个专有科学数据库(如植物、动物、微生物、疾病等)定向查询,提升数据获取效率。
在科研成果发表方面,深圳国家基因库已打造出国际认可的科研成果全链条支撑体系,通过 FAIRsharing 认证及 re3data 收录,支持 Elsevier、Wiley、Taylor & Francis、Oxford、Cell Press、Science 等多个国际著名出版社/系列期刊投稿发文,已助力 1902 篇论文在 Science、The Lancet 等顶级期刊发表。同时,为数据赋予唯一 DOI 标识,保障中国科研人员成果在全球的可追溯性与学术话语权。
尽管目前在数据体量和部分尖端技术上,CNGB 与美国数据库仍存在一定差距,短期内难以实现完全替代,但这些自主可控的数据资源,已然为国内科研筑牢根基,让我国科研在数据层面拥有了更多底气。只要科研界携手并肩,让我们的数据库充分发挥效能,替代美国数据库、引领全球科研发展的那一天,一定会到来。
数据自主:重构全球科研秩序
此次禁令不仅仅是一次技术封锁,更是全球科研秩序重构的信号。作为粤港澳大湾区生物数据要素流通枢纽的核心引擎,深圳国家基因库(CNGB)正以开放之姿,投身全球合作。
其发起的地球生物基因组计划(EBP)、百万微生态计划(MMHP)、万种鸟基因组计划(B10K)、万种植物基因组计划(10 KP )等国际大科学计划,吸引全球科研力量聚焦生物多样性研究,不同国家科研团队共享数据、协同攻关,推动基础生物学认知飞跃。时空组学联盟(STOC)等前沿科学组织的成立,更是将各国顶尖科研人才汇聚一堂,引领生命科学前沿探索。
不仅如此,CNGB 还联动拉脱维亚经济部、老挝科技部、阿联酋国际盐碱植物研究所等多元机构,牵头发起“一带一路”生命科技促进联盟倡议,毫无保留地输出标准化样本库和数据库技术体系,搭建起跨国科研合作桥梁,带动沿线国家生物科技产业协同发展,为 “一带一路” 生物经济注入澎湃新动力,彰显中国在全球生命科学领域的担当。
依托自主可控的数据库生态,深圳国家基因库不但为国内科研应急兜底,抵御外部封锁,还将为全球科研机构贡献“开放共享、安全可信”的中国方案,重塑全球科学数据合作的“中国范式”。