全国人大代表、中国科学院院士、中国科学院上海营养与健康研究院院长李林
近几年,在我国,生物医学大数据已经成为增速最快的大数据,除了基因组学、蛋白质组学、表型组学等产生的大量数据,还有很多人群队列研究数据、生物样本数据……而且,随着现代医学正在进入个性化治疗的时代,无论用于健康跟踪、疾病治疗,抑或科学研究,这些与个人生命信息密切相关的数据如何存放、共享、挖掘,以及不被非法获取和利用?
“目前我国发表在国际期刊上的文章,几乎一半与生命科学有关。要在顶级期刊发表论文,将研究数据提交给欧美几大生物数据中心,是国际通行的做法。”中科院上海营养与健康研究所研究员、生物医学大数据中心主任李亦学初略估计,多达数千TB的生物学数据目前存储在国外生物数据中心,背后则是成百亿元的国家科技投入。另一个“怪象”是,通过“出口转内销”,国内同行在国际平台上实现了国内难以实现的数据共享。
全国人大代表、中国科学院院士、中国科学院上海营养与健康研究院院长李林在2019年两会期间表示,我国应建立自己的生物医学大数据管治体系。
“国际上曾发生多起生物医学大数据泄露所引起的安全事件,引起各国高度重视。欧美等发达国家和地区针对数据安全管理与个人隐私保护,均建立了相对成熟的法律体系与监管框架。”李林告诉记者,近年来,我国建立起了不少与生命科学相关的大科学设施、正不断发起国际性的大科学项目,与此同时,还有更多的医院、科研机构会涉及到生物样本的收集、数据产生与分析,“一旦发生数据泄漏,将引起一连串的社会问题。”
为了更形象地说明,李林举个例子, “随着基因检测技术的发展,理论上只需大概75个统计上独立的单核苷酸多态性(SNP)位点即可唯一确定一个人,当基因检测数据与一些病理数据相遇时很容易匹配到具体的人,从而侵犯个人隐私,极易造成基因歧视。” 75个SNP位点是什么概念呢?一个人身上,大约有300万个SNP位点。只需要你的4万分之一的SNP位点信息,理论上即可将你锁定!
自开展人类基因组研究以来,我国已产出大量与人类及医学相关的基因组及其他组学研究数据,仅存贮在国际基因数据库的组学数据中,就有30%以上来自中国,是名副其实的“数据大国”。
李林提到,欧美国家已经有了相对成熟完善的相关法规来保障生物学大数据的隐私安全。比如,欧盟采取统一立法与统一监管部门的模式;美国以《隐私权法》为基础,将分散立法和行业自律相结合,作为生物医学大数据的法治基础;日本、韩国等国家或地区也已针对个人信息保护立法。
我国尽管2016年《国家重大科技基础设施“十三五”规划》已经将“国家生物医学大数据基础设施”建设方案列入五个后备项目之一,但因设施建设仍未精准落地,海量生物医学大数据仍分散存储在机构甚至个人手中,碎片化严重,交互共享效率低下。另外因为缺乏统一的国际交流窗口,国家数据管理规范难以落实,数据流失严重,实际上成为最大的数据输出国,严重影响国家数据安全。李林建议,针对数据安全与个人隐私,自上而下地建立多层级联动的前瞻性治理体系。并建议按照从严格到宽松的不同程度,将监督机制划分为法律体系、监管框架、行业自律和公共商讨四个层级。
“我国的生物医学大数据专项法案尚存空白,而且缺乏行业标准。应尽早立法,让生物医学在法律制度保障下健康发展。”他建议,在尽快立法的同时,国家还应设置基于指导引领与管理监督的专业机构与职能部门,并加强基于生命周期与安全防护的行业标准与企业规范的建设。
本文综合自经济日报、科技日报、文汇报等。