“被挡在美欧生物数据库之外后,中国发力:这件事像芯片一样重要”

2026-04-28 16:00  观察者网

【文/观察者网 王一】

随着美国和一些欧洲国家开始限制中国科学家访问其数据库,生物医学数据正越来越多地被视为一种战略资源。但对中国科学家张力来说,这件事和芯片一样,"中国发展芯片首先是因为它很重要,而不是因为地缘政治紧张局势"。

之前在美国从事科研工作时,张力曾被一种高效流程深深触动:上午提取人体组织,下午就能进行数据挖掘。相比之下,他更早前在中国学习生物数据科学时,并没有见过这样精简高效的科研流程。

受到启发后,他回国加入北京脑科学与类脑研究所(CIBR),着手推动一项国家级数据库项目,计划收集3.3万名儿童的血液和DNA样本,以帮助识别脑部疾病及其风险因素。张力说:"生物医学数据极其宝贵,是我们寻找疾病解决方案、延缓衰老的基础。"

美国彭博社4月28日报道称,张力所在的实验室,是中国快速扩张的生物样本库网络的一部分。生物样本库是储存血液、唾液、细胞等生物材料和相关数据的大型仓库,构成药物研发的重要基础设施。

如今,这一领域已经成为地缘政治竞争的新前线。全球生物研发经济规模预计将达到数万亿美元,而西方长期在这一领域占据主导地位,中国正借助政府支持的生物样本库体系,对此发起挑战。

对中国科学家而言,拥有本土生物样本库意味着生物技术企业的发展速度可能进一步加快,也有助于巩固中国作为全球创新中心的地位。然而,在美国和其他西方国家开始限制中国科研人员获取部分敏感数据库并收紧国际合作参与后,这一基础设施建设的紧迫性进一步上升。

报道指出,曾经在全球科研界广泛共享的生物医学数据,正日益被视为类似半导体或先进人工智能的战略资源,被纳入国家安全范畴,各国对竞争对手的访问愈发谨慎。这一变化带来的结果是,科研生态正从开放共享,逐步走向碎片化与激烈竞争。

"生物数据作为一种战略资源的概念在美国确实愈发流行,尤其是在人们越来越认识到与中国在生物技术和生物经济领域的竞争之后。"美国乔治城大学安全与新兴技术中心研究分析师维克拉姆·文卡特拉姆(Vikram Venkatram)称。

去年,美国禁止来自中国和其他5个国家的研究人员访问美国国家卫生研究院维护的21个生物医学数据库,并限制部分中国生物科技公司参与政府资助的合同。美方官员声称,一些全球最先进的基因信息可能被用来威胁国家安全、公共健康,甚至带来军事优势。

这种负面情绪已经蔓延开来。英国政界跟着对中国科研人员使用其生物样本库数据表示"担忧"。今年2月,欧盟也将中国机构排除在一项耗资935亿欧元(约合7475.23亿元人民币)的旗舰科学项目"地平线欧洲"计划之外。

多位中国科学家表示,这些限制已经对一些研究造成影响,不过其全面影响仍有待观察。

在外部环境趋紧之际,中国开始加强对本国数据库的保护,2020年通过的《中华人民共和国生物安全法》,对基因数据的采集、存储和跨境传输作出了更严格的规定。

美媒评价说,尽管中国建设一体化生物样本库体系起步较晚,使其在不少近期科研成果上仍高度依赖西方数据,例如通过滴血预测痴呆、开发中风治疗药物等,但中国积极推动科技自立自强,在人工智能、半导体、能源和材料科学等战略领域不断取得进展,这也正延伸至生物样本库基础设施上。

拥有14亿人口的中国并不缺数据,但其生物样本库体系长期较为分散,不同机构在数据采集和存储标准上各不相同。目前,中国的医院、高校和科研机构正加紧整合、数字化海量样本,打造生物科技创新的核心引擎。

深圳国家基因库 深圳市大鹏新区政府网站

2016年建成的深圳国家基因库,现已发展为全球规模最大的生物样本库之一,并且仍在持续扩张,正逐步走向成为全球最大的生物银行。该项目被称为"中国的诺亚方舟",已存储来自人类、动物、植物和海洋生物的1000万份血液和细胞样本,并在去年开始进一步整合全国10个生物数据库。

与此同时,中国国家基因组科学数据中心的数据文件总量在过去两年翻倍,并整合了来自全国的8个大型数据库。

美国外交关系协会全球卫生高级研究员黄严忠表示,中国推动生物医学数据自给,是其总体国家安全观的一部分,不希望在关键资源上受制于与之存在地缘政治紧张关系的国家。

生物样本库中存储的详细生物医学数据是全球生物技术竞赛的关键基石,事关重大。例如,通过分析疾病的遗传与环境驱动因素,研究人员可以帮助开发精准医疗,即利用患者的生物标志物来制定个性化用药方案。

彭博社承认,从理论上看,中国在生物医学领域的进展及基础设施投入,可能为全球带来益处,尤其是在提升数据的族群多样性方面。长期以来,这一数据主要基于欧洲人群,而不同族群在基因变异、疾病机制和药物反应上存在显著差异。但现实是,美国限制中国研究人员使用美国数据库正在削弱全球开放的科研体系,导致信息孤岛化。

无论如何,中国科学家眼下更现实的重点是,先把健康数据基础设施搭建起来,以迎接一个由人工智能带来新可能性的未来。

张力正进行的项目涉及70多家医院和科研机构,预计将持续15年。该项目所积累的基因信息、调查和脑部扫描数据,有望使其成为全球规模最大的儿童和青少年心理健康生物样本库,并为多动症和自闭症发病率的上升提供重要洞见。