全民聚焦精准医疗
今年3月我国成立了精准医疗战略专家组,国家卫计委和科技部多次召开会议,论证启动精准医疗计划。一时间全国各地与精准医疗相关的机构和协会如雨后春笋一般出现,例如北京协和医院、四川大学华西医院等三甲医院筹建的精准医疗研究中心。各地与精准医疗相关的论坛和项目也如火如荼的开展起来,例如在杭州举办的第四届Bio4P国际高峰精准医疗与智慧健康论坛,华西医院开展的总数达一百万人的全基因组测序,据悉中科院北京基因组研究所以及几家大机构已经在启动类似的百万人全基因组测序计划。
7月29日在央视《朝闻天下》的一个栏目里面,新闻频道针对“聚焦精准医疗”主题对精准医疗做了一个老百姓通俗易懂的介绍。简单来说,精准医疗就是利用现代化的医学手段为患者制定个性化的预防和治疗方案。节目全面回应了这一在2015上半年引爆科学界和医药圈的概念。
然而故事还没有结束,媒体报道里面每天充斥着各种医疗概念和技术:分子学诊断、基因检测、靶向药物、个性化用药。。。
但是,这些都是“医疗”,“精准”去了哪里呢?实现“精准”的大数据和云计算应该在哪里体现呢?
精准医疗的核心在于精准,而不是医疗
医疗本身有其发展的规律和方式。这里精准的实现,需要医疗大数据的实现,而实现医疗大数据的前提,需要云计算的助力。
然而我们必须清楚的一点,云计算无法解决医疗问题,只能是快速准确发现问题的存在。云解决方案既无法解决医疗问题,也无法发现医疗背后的大数据问题,能够发现问题的,在于生物信息学。
是否生物信息学需要云计算才能解决临床问题,这里需要打上一个很大的问号。
云解决方案能够助力生物信息提供解决方案,但不是一个必需品。好比我们需要解决的是吃饱问题的时候,花太多的时间在研究用绿色还是红色的碗子盛饭,用深盘子还是浅盘子来盛菜,这些都是无法解决痛点的无用功。
现在中国云计算的现状就是这样,一方面云计算在各个行业还没有做到足够深的整合和足够广的覆盖度,另一方面在传统医疗领域还没有达到足够完善的信息化。
信息化不等于大数据英特尔公司生命科学全球总经理Ketan Paranjape曾经在接受记者采访时提到过大而复杂的基因数据在采集、传输、存储、分析等方面,带来了对计算的要求、对存储的要求、对网络的要求,包括高性能计算。
从大数据的采集层面来看,这里需要国家的投入。在中国基因行业的发展中,这方面投入的最多的当之无愧是华大基因了。其中最值得耐人寻味的是,数据采集本应该是国家投入的基础科学研究,在中国却成为了让企业来承担的一项工程。
毫无疑问,通过企业烧钱来完成数据采集这一步,这种模式是无法复制和模仿的。用华大基因首席科学家李英睿先生的话来说:“华大基因一方面是做基础的科学研究,另一方面是把基础科学的研究成果转化为公众可以使用的真实产品。我们主要通过整合各种平台和技术手段给公众提供相应的临床服务。”换一句话来说就是,华大基因从上游到下游,从B端到C端,从产学研闭环来说,已经全部能够通吃通做。
既然华大基因能够通过通吃来完成数据采集,我们不得不提出一个问题:大数据的本质是什么?
大数据的形成一定不是由垄断的巨头来完成。大数据的4V特点是大量 (Volume)、高速 (Velocity)、多样 (Variety)、价值 (Value)。这里的数据有一个产生的过程,产生的过程能够进行采集。很多的互联网巨头通过控制数据的入口来达到大数据的采集,比如谷歌和百度。
在产业界,各企业对数据入口的争夺一直都没有停止过。入口能够随着科技的发展和人们生活方式的改变而发生迁移,比如从微博到微信,从网页端到移动端。对入口的控制通常可以通过控制设备实现,也可以通过平台实现。比如苹果手机和小米手机就是通过设备来实现控制数据的入口,微信平台就是通过控制平台实现了数据流量的入口控制。
设备和平台在基因行业,最终能够实现入口为王的两个方式:设备和平台。
采集数据需要设备,分析数据需要平台。这里的设备只有实现互联网化的智能设备,才能胜任大数据时代通过控制设备达到控制入口的目的。比如Illumina的测序仪,如果只是一台生产基因数据的仪器,Illumina是无法成为未来基因行业巨头的。只有让每一台设备接入Illumina的在线追踪系统,Illumina的系统能够追踪每一个上机的样本信息,一旦设备接入互联网,所有的样本信息和数据信息能够自动同步到设备控制的数据中心进行采集。每一台设备不仅能够传输设备的状态监测数据、样本信息,还能够传输每台设备的使用情况和地理位置。这些数据的采集便是通过设备来控制数据的入口。
另一个数据的入口便是数据分析平台,这里通过对数据的处理和分析实现对入口的控制。仪器设备厂商能否也做这一块呢,答案是可以的,不过代价非常的高。其中一个关键的原因在于基因数据分析的个性化和碎片化。要解决这个原因的答案就是平台,这里的平台不是云平台。很多的人分不清基因大数据平台和基因大数据云平台这两者的区别,其实能够类比的例子就是阿里巴巴平台和阿里巴巴云平台。
云平台只是实现平台的一个技术载体,真正的核心不是在于云计算本身,而是在于对平台的运营和模式的实现。所以很多人对于奇云诺德的理解就是基因大数据云平台,而忘记这里准确的定义是基因大数据平台,云平台只是实现在线的一个技术模块。如果说滴滴打车的核心在于托管滴滴打车平台的云平台,显然这是很错误的理解。
只有明白了这一点,我们再来看云计算对于精准医疗的助力,只能是实现精准的计算载体。从云计算对于数据采集的入口来看,这里更大的贡献其实是解决了数据的碎片化。通过互联网的在线平台把碎片化的资源整合起来实现大数据采集。
从这样的趋势来看,云计算的发展是去中心化一个过程,最终像华大基因这样的巨头控制的数据采集方式会被云计算的推广所弱化。以云计算为核心的基因大数据平台会迅速的发展起来。这是实现精准医疗的第一个阶段,数据的云端化。
云计算助力精准医疗的第二个阶段,实现数据的安全性管理。
没有一家企业能够保证数据的安全性。商业界的规律永远是用户为王。用户对于数据安全和个人隐私的意识是与生具有的人性,用户的对数据安全的敏感度取决于维护的代价和门槛有多高。基因数据的安全性从数据产生开始就存在,具体在哪个环节得到用户的重视,取决于基因产业的成熟程度。云计算在数据安全性问题解决方案上面已经相对成熟,具体到基因数据是否适用,我相信这是一个技术问题而不是一个道德问题。但是有一点能够肯定的是,基因数据的安全性维护必定托管于第三方属性很强的平台,而不会是华大基因这样的数据生产供应商。因为要用户接受裁判和运动员都是同一个人是很难理解的,除非这个行业非常的小众和封闭。