癌症研究新趋势——全基因组重测序

2014-07-11 16:59 · 诺禾致源

癌症是由遗传因素、环境因素等多因素导致的复杂疾病。因其个性化的特点-每个人/甚至不同细胞都具有独特的遗传突变,从而加大了癌症治疗及监测的难度。而高通量测序技术的发展为我们带来了契机,不仅可以加速揭开癌症的病因及机制,更进一步使个性化医疗成为现实。

癌症是由遗传因素、环境因素等多因素导致的复杂疾病。因其个性化的特点-每个人/甚至不同细胞都具有独特的遗传突变,从而加大了癌症治疗及监测的难度。而高通量测序技术的发展为我们带来了契机,不仅可以加速揭开癌症的病因及机制,更进一步使个性化医疗成为现实。

2014年之前由于全基因组重测序价格仍然高昂,科研人员不得不舍弃部分遗传信息(如基因融合、染色体重排等),而选择外显子组测序——仅针对编码区的SNP/InDel进行检测。随着全基因组测序成本不断下降,尤其是诺禾致源公司引进的X-Ten平台,率先推出“万元基因组”测序活动,使得国内的全基因组测序变得更便宜更快捷,因此,全基因组重测序已成为癌症研究的最佳选择。

全基因组重测序的必要性

2011年,Chapman等人在Nature上利用多发性骨髓瘤样本对全基因组与全外显子组测序进行了比较,结果表明多发性骨髓瘤中一半的蛋白质编码突变都是通过染色体畸变(如易位)发生的,故大部分突变都无法通过外显子组测序发现。相对于全外显子组测序,人类基因组重测序已在检测基因融合,基因组突变,染色体碎裂和染色体重排等研究中屡建奇功。

癌症研究中重要的遗传信息

基因组突变所有癌症在发展过程中都会积累大量体细胞突变,其中司机突变(Driver mutations)是对癌症发展很关键的体细胞突变,而剩下的就被称为乘客突变(Passenger mutations)。2011年Berger等人在Nature上发表了原发性人类前列腺癌及其配对正常组织的完整基因组序列研究。一些肿瘤包含复杂的平衡重排链(拷贝数中性),它们通常发生在已知癌症基因中或附近。而一些断裂点发生在基因间区域,可能会因外显子组测序错过,因此,这篇文章例证了有些突变(如文章中类似于基因间区域的非编码区)只有也只能通过全基因组测序才能检测出来。

基因融合

基因融合在基因组中非常普遍,也是一些类型癌症的标志。基因融合是由两个不相关的基因发生融合形成的一种基因产物,该产物具有全新的功能或与两个融合基因不同的功能。配合末端配对(Paired end, PE)测序技术使用的全基因组测序是目前检测所有基因融合的最准确、最全面的工具,对这些基因融合的检测包括了重复、倒位、覆盖和单碱基插入缺失各种类型。2014年,癌症基因组图谱(TCGA)联盟采用全基因组重测序和全外显子组测序结合的方式对131例膀胱泌尿上皮癌进行了研究,研究者发现了FGFR3与TACC3的融合现象,7例肿瘤样本中检测到病毒整合位点,相关研究结果发表在Nature上。而类似这样的基因融合和病毒整合位点是全外显子组测序做不到的,仍然只能通过全基因组测序的方式进行研究。

染色体碎裂

该现象是一个一次性的细胞危机,该过程中成百上千个基因组重排在单次事件中发生。这种灾难性事件的后果是复杂的局部重排和拷贝数变异,其范围限制在0-2个拷贝。据估计,染色体碎裂发生在2-3%的癌症的多个亚型中,以及约25%的骨髓中。染色体重排需借助DNA双链断裂和一定方式的排列连接,这种重排破坏了基因组的完整性,继而参与形成白血病、淋巴瘤和肉瘤。它的复杂性和随机性使得它成为一种很难研究的现象,目前的解决策略是使用末端配对和长距离末端配对(mate-pair)技术建库的全基因组深度测序方法进行研究。

基因组改变和拷贝数变异(CNV)

目前的研究结果告诉我们,若分析中只关注SNP势必将错过大部分重要的基因组重排。据估计,每个人类基因组中“非SNP变异”总共约有50Mb。Morrison等人选用膀胱移行细胞癌(TCC-UB)的5例样本进行全基因组重测序,结果发现,其中3例样本具有较多SNP和SV变异,并且都具有P53基因的突变;在另外2例肿瘤样本中,研究者发现谷氨酸受体N-methyl-D-aspertate receptor基因发生易位和扩增,该研究结果对后期的肿瘤药物靶点鉴定与疾病治疗具有重要作用。由于覆盖深度变化太大,导致对原拷贝数的变异不敏感,全外显子组测序不容易检测到CNV,对于大片段的基因组改变更是无能为力。

下表是全基因组测序与全外显子组测序的一个比较。

测序方法 检测范围 测序深度 操作复杂度 检测变异类型
全基因组重测序 全基因组范围 30~50X测序深度,90~150G数据量 只需构建小片段文库,实验操作方便 全基因组范围内的SNP, InDel,CNV, SV以及融合基因
全外显子组测序 仅对1-1.5%的基因组测序 50~100X测序深度或更高,5~10G数据量 需要对外显子区域进行捕获富集,操作复杂 只能检测外显子区域的SNP和InDel

正是基于以上的优势,近年来采用全基因组重测序作为研究手段发表的高水平文章越来越多,这也会是将来人类基因组学研究的趋势,预测相关科研成果将呈现井喷式增长。


全基因组重测序应用论文发表趋势(基于PubMed数据)

小结:从技术层面来讲,和全基因组测序相比,全外显子组测序目前只有测序深度上还略有优势,但随着诺禾致源在国内首家配置HiSeq X Ten测序平台,酝酿良久的人类万元基因组已经开启了人类基因组学研究的新篇章,在未来1~2年时间内,全外显子组测序还会在肿瘤及遗传病的科研、诊断中占有一席质地,不久的将来,便会大范围地被全基因组测序替代。我们更可以大胆推测,全外显子组测序有可能会在3年后退出测序舞台。