2013年,Affymetrix推出一款标志性的产品——Affymetrix Genechip®人类全转录组芯片(Human Transcriptome Array,HTA),这是一款高分辨率的基因表达芯片,旨在增强新一代的基因表达图谱研究,该芯片除了检测基因水平的表达图谱,还可以准确分析几乎所有已知的转录本异构体。
在表达谱芯片上质的飞跃
在HTA面世之前,Affymetrix用于研究RNA水平的芯片产品都称为表达谱芯片,虽然后来也有GeneST系列和ExonST系列产品,也只是翻译为基因芯片和外显子芯片,一直没有使用组学的概念。因为这之前的芯片功能都比较单一,都是针对转录本,基因或者外显子的表达量进行研究,虽然Affymetrix之前的高密度芯片也可以做一些剪切调控的预测,但灵敏度一般,并不是这些芯片的主要功能。
而这一切,在HTA芯片面世之后发生了颠覆。HTA芯片除了检测基因水平(包括所有编码基因和长链非编码基因)的表达图谱,还可以准确分析几乎所有已知的转录本异构体,对转录本异构体的检测灵敏度远超过同等价位的RNA-seq,所以,这款芯片被命名为人类全转录组芯片,是第一款被冠以组学应用芯片。
*Let Professionals Serve Professionals基因有限公司www.genecompany.com*
无与伦比的探针设计
超过六百万条不同探针,覆盖编码和非编码转录本。
芯片设计和注释的数据库来源包括:
RefSeq、Ensembl、UCSC(known genes and lincRNA transcripts)、Vertebrate Genome Annotation(Vega) database、Mammalian Gene Collection(MC)(v10)、www.nonecode.org
、IncRNA、db、BroadInstitute、 Human Body Map lincRNAs and TUCP catalog。
每个外显子设计约10条探针,每个外显子之间的剪接点有4条探针。
这种设计方式确保每个实验都能获得完整、准确和可重复的数据。一个典型的基因(LMNB1,如下图所示)包含了许多转录本异构体,测定每个转录本异构体相对丰度的变化为疾病和生物学研究提供了新的启示。HTA提供了外显子和亚外显子水平的表达变化分析,同时能检测可变剪切所产生的转录本异构体。每个独特外显子区域都设计了10条探针以检测一个基因所有转录本异构体。此外,HTA为每个已知的可变剪切位点设计了4条特异的探针(未在图中显示),每个基因平均有140条探针。通常RNA-Seq实验只和RefSeq数据库进行比对分析,在这个例子中,LMNB1基因只有3个转录本异构体可以通过RNA-Seq检测到(第2、3和13条转录本异构体)。HTA整合了多个数据库的内容,实现了所有的15个转录异构体的全面分析。
*Let Professionals Serve Professionals基因有限公司www.genecompany.com*
比RNA-SEQ更精准,更灵敏
RNA-SEQ目前普遍采用的10-40M Reads的测序深度,会遗漏许多低丰度和中等丰度基因的差异化信息,同时也会遗漏外显子水平的变化和可变剪切的发生。而HTA芯片无论转录本丰度高低均能提供精确的基因表达数据。Cell 文章显示,往往低丰度表达基因才是具有决定性意义的差异基因,因此低丰度表达基因检测的准确性尤为重要。如下图显示了转录本表达水平的中值(x轴,log2 Reads Per Million,RPM)和检测的CV值(y轴,Coefficient of Variation)的关系,其中红点及其拟合曲线(红线)为HTA基因表达芯片结果,蓝点及其拟合曲线(蓝线)为Illumina® HiSeq™ 2000系统测序结果(RNA-Seq,100+100 bp read-pairs),分别从基因水平和外显子水平分析了转录本表达水平。结果表明,所有的RNA-Seq数据(除了最深度的测序之外)都显示出了明显的背景噪音,因此将会遗漏重要的差异表达信息。(A)=1/8HiSeq lane 30 million mapped reads;(B)=1/2 HiSeq lane, 120 million mapped reads;(C)=2HiSeq lanes,480 million mapped reads。