导读:美国西奈山医学院的研究人员开发出一种方法,可从RNA等非DNA来源获取足够的DNA信息,清晰识别出具有特定生物信息特征的个体。这是首次从RNA水平开始描述DNA序列。相比而言,大多数有关DNA和RNA的研究都以DNA序列作为开始。相关研究报告发表在4月8日的《自然·基因学》杂志网络版上。
DNA可组成遗传指令,引导生物发育与生命机能运作。RNA是具有细胞结构的生物遗传讯息中间载体,参与蛋白质合成和基因表达调控。新技术能利用在任意组织内监控到的基因表达水平,由RNA数据推断出一个人的DNA。
科研人员使用一种算法,可匹配基因的表达模式和基因组中1000个单链DNA的变化,这是一种综合生物学的应用,可检查多维(DNA和RNA)数据,并更好地报告一种给定的维度(RNA)。科研小组分析了378个肝脏捐献者的RNA和DNA,以及基于同一群组的580名需进行胃旁路手术患者的肝脏和脂肪组织。他们发现,许多基因的RNA水平都与个体的年龄、性别和体重等特征相关,但更多的则是其与个体特定的DNA变化的关联。
科学家表示,此项研究中DNA和RNA的关系就好比管弦乐队和其演奏的交响乐。他们可以在听到交响乐(RNA模式)时,推断出演奏的乐器(DNA序列)。通过观察特定组织的RNA水平,能推断出“基因条形码”独特的标记方式,使其匹配独立获取的个体DNA样本。此外,某些组织中的RNA水平还能告知个体所患的疾病,如阿尔茨海默症和癌症等,以及个体可能罹患相关疾病的风险。科学家称,此项发现的意义已超出了医学领域。从参与科研的个体处获取的“条形码”,其RNA的水平将被监控并存放在公开的数据库中,这可用于测试在犯罪现场留下的DNA样本,作为识别案件相关人的一种方式。
科研人员同时强调,现今已经很难将个人信息屏蔽起来不为外人所知晓。他们希望这项研究可平息人们关于个人隐私保护的潜在争论,鼓励病患提供生物信息等数据,这将有助于医生更好地进行诊断和治疗,也将为医学的发展作出更大贡献。
Bayesian method to predict individual SNP genotypes from gene expression data
Eric E Schadt, Sangsoon Woo & Ke Hao
RNA profiling can be used to capture the expression patterns of many genes that are associated with expression quantitative trait loci (eQTLs). Employing published putative cis eQTLs, we developed a Bayesian approach to predict SNP genotypes that is based only on RNA expression data. We show that predicted genotypes can accurately and uniquely identify individuals in large populations. When inferring genotypes from an expression data set using eQTLs of the same tissue type (but from an independent cohort), we were able to resolve 99% of the identities of individuals in the cohort at Padjusted ≤ 1 × 10−5. When eQTLs derived from one tissue were used to predict genotypes using expression data from a different tissue, the identities of 90% of the study subjects could be resolved at Padjusted ≤ 1 × 10−5. We discuss the implications of deriving genotypic information from RNA data deposited in the public domain.
文献链接:https://www.nature.com/ng/journal/vaop/ncurrent/full/ng.2248.html