单分子测序技术揭示艾滋病毒剪切新模式
最新一期Nucleic Acids Research上发表了一篇利用PacBio单分子测序方法对HIV-1病毒转录组可变剪切模式的研究。HIV-1病毒是一种典型的RNA病毒,其基因组比目前已知的任何一种病毒基因组都复杂。HIV-1只有一个转录起始位点,却有多种剪切异构体,是研究可变剪切的一种较好模型。
艾滋病毒剪切新模式
在采用第二代测序平台研究转录组的可变剪切时,生成的片段过短,需要进行片段拼接后才能分析选择性剪切。然而片段拼接会失去转录组可变剪切的真实信息,往往只能通过猜测和推断来分析剪切位点。而单分子测序则不同,其生成的长片段能够使研究者们一次性完成对cDNA的通读,直接识别剪切位点。
PacBio单分子测序的一大突出优势就是读长长,利用这样的长读长研究者们就能够更容易的分析选择性剪切模式。在这项研究中研究人员先将HIV-1的转录组进行反转录,随后再进行cDNA测序。研究人员分别提取不同病人体内感染了HIV-1病毒的T细胞和HOS细胞中的RNA,反转录获得了病毒的cDNA产物,而后在PacBio平台上进行单分子测序。通过分析,他们发现了109个HIV-1独有的可变剪切产物,其中两个还编码新的蛋白。研究表明,HIV-1的剪切模式具有很大的异质性,在不同细胞、不同病人中其剪切模式和异构体明显不同,而且即使是在同一细胞同一病人中,在不同的时间段剪切模式也会发生改变。
该研究证实,PacBio生成的长读长数据能够很好的帮助研究人员进行转录组研究,有助于在大范围内对可变剪切位点进行直接分析。此外PacBio的CCS测序模式能够提供准确度非常高的序列数据,使得转录组可变剪切位点分析更加准确。
Dynamic regulation of HIV-1 mRNA populations analyzed by single-molecule enrichment and long-read sequencing
Karen E. Ocwieja, Scott Sherrill-Mix, Rithun Mukherjee, Rebecca Custers-Allen, Patricia David, Michael Brown, Susana Wang, Darren R. Link, Jeff Olson, Kevin Travers, Eric Schadt, and Frederic D. Bushman
Alternative RNA splicing greatly expands the repertoire of proteins encoded by genomes. Next-generation sequencing (NGS) is attractive for studying alternative splicing because of the efficiency and low cost per base, but short reads typical of NGS only report mRNA fragments containing one or few splice junctions. Here, we used single-molecule amplification and long-read sequencing to study the HIV-1 provirus, which is only 9700 bp in length, but encodes nine major proteins via alternative splicing. Our data showed that the clinical isolate HIV-189.6 produces at least 109 different spliced RNAs, including a previously unappreciated ∼1 kb class of messages, two of which encode new proteins. HIV-1 message populations differed between cell types, longitudinally during infection, and among T cells from different human donors. These findings open a new window on a little studied aspect of HIV-1 replication, suggest therapeutic opportunities and provide advanced tools for the study of alternative splicing.