在刚刚结束的一年一度的基因组生物学技术进展大会(AGBT)上,华大智造携旗下的Complete Genomics(以下为CG)重磅推出了超高通量测序平台DNBSEQ-T20×2,一时间炸开了略显乏味的测序圈话题热议。
MGI全线登陆,CG闪耀重返
经历第一波基因测序开发热潮的人们都还记得CG。CG创新性地推出了DNA NanoBalls (DNB) 测序技术,并以持续推动基因组价格下降而为人知晓。
技术进步推动基因组测序成本持续下降,预期将在今年底实现100美元基因组
2013年,华大集团力压当时蒸蒸日上的Illumina,最终以1.176亿美元的价格收购了CG。这无疑也将成为NGS历史上最伟大的并购之一。因为Illumina非但没有通过并购淘汰CG这一当时最有力的竞争对手,同时又多了华大这个事后将力主与其全球竞争的强大对手。
华大收购CG不久就推出了桌面型台式测序系统,后经业务调整,CG又转入并成为华大智造的核心。在成长的6年中,华大智造基于DNB测序技术推出了6款测序平台,成为了发展最快的测序仪厂商。
2019年,意气风发的华大智造在首次进军美国市场的时候遭遇了老对手Illumina的专利围堵,虽然华大智造在绝境中推出了创新性CoolMPS化学,但也没有逃过专利战的阻击。经过近3年、波及20多个国家及地区的专利战拉锯,华大智造最终赢得了胜利,并于今年初宣布全线进入美国市场。
这也是收购十年后,CG闪亮回归美国市场。
开放式测序系统:测序工厂的基因传承和创新
早在2008年,CG就提出要实现5000美元的人基因组测序,要知道就在这之前一年,DNA结构发现者詹姆斯·沃森的基因组测序完成耗资了100万美元。要实现万元以下的基因组测序,多少像是痴人说梦!
但此时的CG不想像大多数测序公司那样销售机器,而是定位测序工厂提供测序服务(Sequencing-as-a-Service)。本质上,CG设想能够在一张载片上分析超过十亿个放大的 DNB信号点,将如此多的信息放在一个阵列上可以减少载片的数量和进行测序所需的昂贵试剂的量,加快数字成像的速度,最终通过规模效应带来单位成本下降。这样一来就不需要考虑测序产品化的形态,不需要完全延续传统的集成式测序高度整合生化、流体、光学等部件的设计,而是追求去中心化思路,为考虑实施开放式测序提供了契机。
DNBSEQ测序原理示意
沿着这条思路往前发展,CG在2015年推出了Revolocity系统,实现了测序生化与成像等模块的分离,通过一个机械臂在不同模块之间来回腾挪搬运,实现无人值守的不停歇高通量测序。但当时的华大取消了Revolocity的商业化,转向了台式集成式测序仪的开发及商业化。
Revolocity开放性、灵活性的基因却并没有因此泯灭,在华大智造的新架构下,2018年,DNBSEQ-T7平台震撼发布,日产数据高达6Tb(后经过不断的性能优化,终于实现了7T/天的既定目标),刷新了当时的纪录。T7平台虽然是台式封闭的设计,却把那只挥舞的不知疲倦的机械臂的核心安置在了机箱内里,首创了4联芯片平台,而4张芯片如同4台测序仪一样,能够同时开展不同读长的测序,芯片随时上机,运行中的芯片也互不影响。T7现已成为华大智造的主力机型。
DNBSEQ-T7仪器内部的机械手及四联芯片设置
2020年,华大智造更进一步,推出了DNBSEQ-T10×4平台,这一次真实再现了Revolocity的情景,将原本集成式的测序系统拆解平铺为多个核心组件,在空间上将生化流体与成像分离,并使用大型开放式载片而非固定密封且加盖式流动槽来承载 DNB阵列,平台中央的机械臂在几个流体浸没站和荧光成像仪之间移动载片,从而实现测序反应的顺次进行。这形象地向人们展示了测序工厂是如何运作的,而测序本身也被赋予了生命。T10载片比 T7 的流动槽在规格上大四倍,DNB 在T10载片上的密度是 T7 阵列上的两倍。T10系统可同时运行8张这样的载片,在PE150测序模式下运行6天可产出近120Tb数据量,日产数据量高达18Tb,生产效率是T7的3倍。
这样开放式测序系统的设计使人眼前一亮,但对于华大智造来说,这已经不是测序工程化的新思路,它更像是对CG一以贯之的高效测序工厂理念的传承和致敬,但却为持续提升测序通量、降低测序成本、以至实现100美元基因组提供了产品设计的框架。
超级测序工厂T20重磅问世
与T10定制化的形态不同,此次华大智造/CG推出的T20实现了标准化的测序设置。
2020年推出的T10×4 RS(RS为Research的缩写) 由4台光学系统和1台生化反应系统组成,作为“大人群基因组学一站式解决方案”的核心测序模块,通过搭配样本前处理、文库制备、基因数据管理等其他模块,实现样本到报告的全程自动化,这一全流程可根据客户需求定制数据通量。
相比之下,T20x2占用空间比T10x4小不少,配备了 2 个成像器和一个可处理 6 个载片的旋转机械臂,固定搭载PE100(每次运行产生42Tb)和PE150(每次运行产生72Tb)两种测序模式。一套T20每年可以产生多达 5万个 WGS,真正兑现了100美元基因组的承诺(30倍覆盖度的人类基因组测序,包含了仪器折旧)。
T20沿用了华大智造创新的浸没生化技术
开放式测序的体系设计背后的重要支撑是华大智造创新的浸没式生化技术,将合成测序所经历的“聚合”、“冲洗”和“荧光基团切除”等步骤所需的试剂分别放置在多个反应槽中,每个反应槽都拥有独立精准的温度控制确保反应的高效进行。使用反应槽的好处在于可以最大化浸没整个测序载片来完成生化反应,T20使用了从整个硅晶圆上切下的大型载片,同时在同一试剂槽中也可以实现多张载片的同时浸没反应和多次反应使用。而无表面盖板测序载片上的浸入式流体技术可在这些大型载片的整个表面上实现非常均匀的反应,不受泊松分布的限制,既最大化信号点的覆盖又减少了试剂的浪费,确保了最大通量和最低成本。
6张载片的同时运转使得单次运行通量远高于现有的“高通量”测序仪,而这一超高通量也对光学成像、图像识别及数据传输提出了超高的要求。提高光学的利用率是解决高速高通量检测的必然出路。T20使用了浸没式水物镜,以提高镜头的数值孔径,进而提高信号点分辨率;另外从发布的介绍视频也可以看出,T20使用的镜头采用了增大的视场,这可以增加图像捕获面积,配合快速的TDI扫描提供了高速高通量信号捕捉。
T20采用了大视野的浸没式水物镜
这样一来,挑战似乎就留给了如何快速地进行图像处理和数据分析。T20使用了专有的两色测序技术,与四色测序相比,既减少了光学器件的使用,同时也一定程度上降低了数据处理的复杂度。但不管怎么说,图像处理背后的算法优化都会是一个繁重的任务,包括数据压缩等创新一定也是少不了的。
不管是T10还是T20,在实现超高通量这条路上,华大智造提供了开放式测序的路径选择。最大化晶圆载片的信号密度,多组载片并行测序,再结合浸没式生化所能提供的试剂成本降低,T10/T20的开发思路再次验证了测序规模提升带来单位成本下降的逻辑。但通量还能不能继续提升、成本还能不能继续下降、测序速度还能不能更快,如果从“集成式还是开放式”的角度来对比的话,似乎开放式测序仍留有想象空间。
大规模组学项目告别“束手束脚
T20创造了基因测序仪单次运行最大通量的新纪录,堪称一座具备超强生产规模的“超级测序工厂”。消息发布的第一时间,相信很多读者的第一反应也是“需要这么大通量吗”“这能卖得出去吗”。
对比市面上这几套高通量测序平台,可以发现T20不管是在最大日产数据量还是每次运行的数据产出上都要比Illumina今年发货的NovaSeq X系列高出几倍。华大智造在T20的产品宣传册中称T20是为满足最具挑战性的测序需求而生,旨在为世界各地的大规模基因组项目提供助力,为多组学在人类健康与疾病中的研究和应用提供工具。实际上,T20定位就是大人群和大组学项目,服务基因组的规模化生产。
主流高通量测序平台的参数对比
建设者在之前的文章中也分析了,不管是全球各地正在兴起的十万、百万级人群测序计划,还是对于动植物生态保护研究的基因组组装测序项目,都逐渐被各测序厂商所重视,毕竟还有相当大的待测序空间。另一方面,随着单细胞渗透科研视野,随着转录组、蛋白组等其他组学技术的开发和采用,多组学测序需求正在快速生长。由于海量数据及规模化生产的特性,这些人群队列、多组学项目对于测序工具的要求也逐渐个性化、差异化。
华大智造在最近的一次演讲中也提到其服务战略的三大方向,瞄准“人群基因组计划”、“单细胞”、“时空组学”这三个大需求去做赋能建设。而T20的诞生无疑为“三箭齐发”提供了完美的弹射器。
最终,大型生产级客户只需要一套T20就能解决大规模组学项目的需求,而不需要购买多套常规高通量测序设备,不需要并列3套或者6套的迷你测序仪方阵,所有重任可一肩挑。
生命科学“工业4.0”的时代来
当然,华大智造产品组合中不只有T20,在不同的测序场景中,智造提供了覆盖“低-中-高-超高”通量的测序平台。然而与Illumina战略进入下游基因检测应用不同,华大智造越来越明确提供工具的角色定位。
定位在核心工具的提供上,赋能和合作生态也是华大智造提得比较多的主题。这不只是从测序工作流程上去讲,也包括推动测序应用行业开发,甚至是带动整个测序核心元部件供应链发展的维度。
事实上,华大智造在测序流程上,可提供端到端“样本到数据”的高通量自动化解决方案,在核心测序之外,华大智造可以提供自己的样本前处理、文库制备及数据分析平台,甚至包含生物样本库的平台。但从公开的消息可以看到,华大智造也还在积极构建或拥抱上游文库制备和下游生信分析的合作,不管是与国内的开发商合作服务国内市场,还是CG在美国选择其他不同的海外合作伙伴,都希望客户正在使用的工作流程最终都能顺利转移并在DNBSEQ测序平台上实施开展。这样的系统兼容性对于推动客户采用自己的测序平台很关键,但同样重要的是,这促进了上游样本/文库制备和下游生信方案的持续创新开发,推动了测序上下游工作流程的同步发展,荣辱与共。
DNBSEQ测序技术经过了多年开发及市场的实际测试,基于DNBSEQ测序平台所发表的经过同行评议的文章数量已经接近4000篇。这无疑为考虑选择DNBSEQ测序平台进行基因测序的应用开发提供了最大的背书。公司刚刚宣布了华大智造国产测序联盟的首批成员,涉及了肿瘤、分子育种、科研服务、单细胞等不同的测序应用开发商。国内企业选择国产测序平台其实是在情理之中,随着国内供应链、生产、本地支持等发展程度的提升,客户可以预期更加稳定的国产供货和交付。此外,华大智造在推动测序成本不断下降这方面的努力自然也构成了合作的一大理由。
华大智造IPO时提交的文件提示,公司已经实现了大部分测序仪核心零部件的国产化取代和供应,并在持续提升这一国产化率。从寡头垄断到如今的百花齐放,行业蓬勃发展的背后是伴随行业成长起来的国产化基础建设。华大智造成长为国产龙头也带动了一批国产供应链的共同成长,包括硅晶圆、测序芯片设计制造、光学器件、微流体、精密仪器控制等配套供应链的成熟和支持无疑会推动国内测序行业的更进一步发展。
随着第二波测序应用开发浪潮的兴起,在2023年当下这个时间点,测序市场诚然拥有了Illumina之外的选项。这对于下游应用开发及终端用户来说都是一大幸事,不光是多了很多选择,同时在上游良性商业竞争推动的技术革新下可以享受测序成本下降带来的便利。随着T20的100美元基因组如期而至,测序应用的更多想象空间将被打开。
华大智造经历了这么多年的积累沉淀愈显成熟,加上其愈加丰富的产品组合,其愈加开放的合作生态,其拥抱更大市场的决心,其推动行业发展的组局者心态,无不让人要再次去仔细审视这家公司。
生命科学“工业4.0”的时代来了。