【直播】祝浩杰：用于药物基因组学研究的一种全新蛋白质组学方法

2017-10-28 00:10 · 张润如

2017年10月27-28日，西安全球硬科技创新大会首场论坛——第四届中国药物基因组学学术大会暨首届中国个体化用药-精准医学科学产业联盟大会在西安曲江凯悦酒店拉开帷幕。美国密歇根大学药学院副教授祝浩杰博士在会上做了《用于药物基因组学研究的一种全新蛋白质组学方法》的报告。

2017年10月27-28日，西安全球硬科技创新大会首场论坛——第四届中国药物基因组学学术大会暨首届中国个体化用药-精准医学科学产业联盟大会在西安曲江凯悦酒店拉开帷幕。本次大会以“药物基因组助力未来健康”为主题，吸引国内生命科学领域的多名院士、专家和企业界代表齐聚西安，就药物基因组学的前沿技术与产业落地进行研讨与交流。美国密歇根大学药学院副教授祝浩杰博士在会上做了《用于药物基因组学研究的一种全新蛋白质组学方法》的报告。

祝浩杰副教授目前实验室的研究主要集中在基于药物基因组学和蛋白质组学的精准医疗。2015年获美国药学院协会(American Association of Colleges of Pharmacy)青年科学家奖(New Investigator Award)，2016年获JBC/Herb Tabor青年科学家奖(JBC/Herb Tabor Young Investigator Award)。

以下是祝浩杰博士报告的具体内容：

我们实验室主要做两个方面的工作，一个是药物基因组学，另外一方面，近两年我们做蛋白质组学方面的工作，这两个工作都是跟精准药物治疗相关的，我们想知道基因突变如何引起药物的差异。另外一方面，我们还想知道到目前为止，每个人都带有差不多300万的基因突变，它们对于基因的表达和蛋白质的活性，到底有什么影响，很多我们还不太清楚。如果不知道基因突变的功能，精准药物治疗就无从谈起。

所以我们目前做蛋白组学主要的一个想法是：想用蛋白表达作为一个表型，去研究基因突变怎么样调整基因的表达。因为今天我们是一个药物基因组学会议，所以先介绍一点我们实验室最近做的关于药物基因组学研究的内容，同时再介绍一下，最近我们建立了一个新的蛋白质组学的方法，讲一下为什么蛋白质组学可以是一个去研究药物基因组学非常有用的工具。

我们都知道CES1，这个酶它在人体内是很重要的，它是一个非常重要的肝脏水解酶，能代谢很多非常重要的药物。CES1基因是高度多态性，已报道了2000多个SNP。它的表达和活性在个体中差异非常大，能超过50倍以上，甚至相差几百倍。CES1的已知底物涉及到很多常用药物。这个表并不完全，只是一个例子。你可以看到这边有非常多的药物是临床常用的，还有很多其他的药物，属于这个酶代谢的。

在关于中枢兴奋药利他灵方面的研究是一个非常有意思的一个故事。这个研究是我们差不多十年前做的，当时我还在做博士后。我对这个药物非常感兴趣是因为有很多人用这个药提高注意力，一些大学生用得非常多，希望能提高成绩。很多人用药的同时喝酒，喝酒之后可能提高这个药的作用。这是什么原因？CES1这个酶能催化利他灵在体内的代谢反应。如果你喝酒的话，首先酒精是酶的抑制剂，所以这个代谢就减弱了，有更多有活性的药物在体内，另外这个酶还能催化一个转酯反应，形成一个活性的代谢物。本身的原药减少了，又有活性代谢物，之前都是体外测试，当时我们想做一个人体的药物相互作用，看人体内有没有什么情况发生。

我们在不同的时间点测志愿者中这个药物的血药浓度，有一个测试者，体内的药物浓度非常高，是其他人的5倍以上。更有意思的是什么？因为我们这个药物有D型和L型两个型，这个L型是CES1更好的底物。在普通人里面做药动力学试验的话，能测的药物大部分是D型的，L型的浓度非常低，因为L型很快会代谢掉了。而在这个测试者里面，L型比D型还稍微高一点，这个就提示，这个人是一个CES1的慢代谢型（Poor metabolizer），因为我们知道CES1是代谢这个药的唯一一个酶。我们同时分析了药效学的参数，心率和血压在正常人群中没有太大的变化，因为我们只给了一个剂量，0.3毫克每公斤，没有特别显著增加。但是在慢代谢型的测试者里面，他心率、血压都有明显的提高，这和体内很高的血药浓度是相关的。

这就非常奇怪了，因为在那个时候，我们还不知道，基因多态性可能会引起CES1表达的变化或者活性的变化。这些志愿者肝功能正常，我们也不允许他们用任何的药物，这个异常也不可能因为是药物相互作用引起的，但是为什么我们会看到这样的慢代谢型呢？当时我们就发现，在这个慢代谢型的人里面这个基因有两个变异，一个是在X4，第四位有个变异。另外一个，它刚才丢掉了。因为蛋白质编码是三个、三个的，丢了一个之后，它后面都错位了。当时这两个差不多是新报道了，以前在数据库里没有这两个变异，我们就看一下这两个变异是不是常见呢？我发现第一个变异，我们叫G143E，这个变异还是比较常见的，在白种人，包括黑人，包括西班牙人都是比较常见的，但是很有意思的是GA突变，在亚洲人里面是没有的。这是刚才我们测了五十多个，后来又测了几百个，东亚人，中国人，日本人，韩国人带GG这样的变异。不同种族之间，不同的变异，它的频率是不一样的，甚至功能也不一样。另外一个变异D260fs是非常少，仅在慢代谢型测试者和他母亲身上带有，其他人都没有。

下面一个问题是我们要回答一下，是不是这两个变异造成功能的变化呢？我们当初把野生型和突变的都转到细胞系里面，这样就可以在体外进行一些功能学的研究。我们首先发现，对于野生型CSE1对L型和D型底物的活性是不一样的，而突变型失去这个差异，这个和体内结果是一致的。

我们还测了它的这个变异对在人肝脏里面的活性影响。在这里面，我们测了一百多个人的肝脏，分析了它的活性。这里面我们发现的是一个杂合子，它的活性差不多是野生型的50%左右：带一个拷贝的野生型，另外一个拷贝是失去功能的突变型，这导致它们差不多有50%的活性。

在我们的研究发表之后，别的组也发现突变型的差别是非常显著的。除此之外我们还做了一些体外试验，还有体内试验，其他的药物，氯吡格雷等，我们发现都是完全一致的，这也是有史以来第一次发现CES1的突变可以引起功能变化。但是问题是，除了这个变异之外，还有其他很多的变异，CES1有超过两千个变异。所以下一步我们做了一些相对比较容易的研究：不同的变异在体外进行一些功能检测，对酶功能的影响还是非常明显的。但是这些变异的频率一般不是太高，大部分都是1%以下的。但是我们知道大部分的变异，对表达的影响比较小，它可能影响了这个蛋白的活性。但如果说你测这个蛋白表达的话，发现它的表达差异非常大，超过50倍以上，我们就需要找到哪些突变会引起这个基因的表达差异？这样的话，我们才能更好的解释这个酶的活性和个体差异。

在做基因调控的时候，我们用表型。现在你可以用高通量得到很多数据，非常方便，也非常可靠。但是我发现很有意思的现象是，你用基因序列作为表型去找它的多态性，但是这些多态性并不能真正解释这个蛋白功能上的差异，同时你可能有一些变异，可能它真的会影响蛋白的表达和功能。这就意味着我们在做这些基因和这些蛋白，必须要是在蛋白水平去做，不然你会有很多假阳性和假阴性的结果，为什么过去这几年我们花了很多时间做方面的工作呢？我们更关心的是，用蛋白表达作为表型去研基因表达调控。但是有一个重要问题就是说，如果你用蛋白表达作为表型的话，你必须要非常精确才可以。我们目前常用的几个定量的蛋白组学方面，它的精准度都有一些问题，所以我们建立这样一个新的方法，叫TAQSI ，用蛋白去作为外标，建立一个标准曲线，做精确定量和绝对定量。

这个方法和其它的方法比有什么优势？比如跟合成的同位素标志多肽组去定量那些方法比有什么优势？第一是能够显著提高它方法的精确度和稳定性、可重复性。为什么这样讲？我举一个例子，打比方我们的方法里面，定量是通过没有标记的，组织里面的多肽来进行定量的话，在这个例子里面，你看不同消化时间情况下，多肽释放是不一样的。但消化时间不同，或者消化效率不一样，对我们这种定量是没有任何影响的，同样的，如果你在样本处理过程之中，多肽的萃取，不稳定性造成的影响，也能在这个方法的控制内。

另外一个，我们在做蛋白定量的时候，有时候会遇到的一个问题：如果你抽到这个多肽刚好有变异的话，你可能认为这个蛋白不表达。但实际不是因为不表达，刚好它是一个变异。在这个例子里面，我们又选了CES1这个蛋白，选了6个。其中五个的定量结果都非常一致，而剩余那个差不多有其他定量结果的一半左右。后来发现实际上它是一个变异，只有一个拷贝，所以为什么你只看到50%左右。因为我们是用全长的蛋白作为类标来定量的，所以我们可以选择很多个多肽进行定量。

另外一个。我们在做蛋白质定量方法优化的时候，有时候挺头疼，如果发现我们选择了一个多肽，发现响应不太好，或者跟其他的多肽之间有干扰的话，你要调整参数，这样子会非常花时间，有时候还得不到你想得到的结果。而用全长的蛋白作为类标，我们会有很多的选择，这样我们只是挑了一些表现最好的进行定量，不好的我们就不用了，某种程度来讲，就省了很多方法优化，这个非常地高效率。

这个方法目前我们用了很多，但是如果用这个方法作为药物研究的话也有一些问题，首先是什么呢？我们知道影响蛋白的表达因素非常多，除了基因突变造成的以外，环境因素影响是很重要的一方面，食物、药物这些都会对蛋白表达有影响。所以说你只是用蛋白表达量差异来寻找这些变异的话，会有非常大的背景噪音。你只是看到蛋白表达增加了或减少了，要回答到底是因为基因突变造成的？还是环境造成的？需要很大的样本量，才能得到比较可靠的结果。

另外一个是不同样本之间的差异，检测时候的批量差异也会对结果有影响，上一个样本做完了之后，下一个样本之间，是你的源被污染了。针对这个，我们建了一个全新的蛋白组学方法，我们简称叫ASPE。大概什么原理呢？这里面有两个等位基因，一个从父亲那边过来，一个从母亲那边过来，如果说你没有任何突变影响这个基因的表达，这两个等位基因表达就是相似的，它们之间的比例应该近于1，如果有个变异，在这里面，影响了表达的话，它们之间的比例就不是1了。我们可以用这个比例来分析，而不是用总的蛋白表达来研究，这个好处是很显然的。

第一个，我们只依赖样本本身，同时测这个比例，这是一个非常大的优势。另外更大的优势是什么？环境因素，非基因型因素对表达的影响，可能会提高蛋白表达或者降低蛋白表达，它们之间的比例还是一样的，不变的。如果表达的比例不变，只是增加减少了，我们可以考虑大部分是因为环境因素和其他因素造成的。

但如果说比例变了，变成大于或者小于的话，我们可以肯定有一个变异在离基因很近的地方。我们在体外合成这样的基因然后让它表达，我们用没有突变的作为一个参照来分析原因。我们这个和普通的还不一样，我们在这里面做了优化，保证这两个等位基因是1：1的，这个非常重要，如果说等位基因表达不是1：1，你就搞不清楚，是什么差异造成的。

这是我们测的结果，这是其中的变异，野生型是Y，突变型是D，通过这两个来定量，再比较这两个的比例。看它之间是不是维持了1：1的比例，这样我们就知道有一些突变的东西在里面影响它的表达，我们发现对于这个基因来讲，UGT2B15也是一个非常大的个体表达差异，比它高的，比它低的，差别很大。更关键的是我们证明了在这个基因里面，这里面我们有17个变异，不然不知道这个蛋白从哪个等位基因变异过来的，里面大部分都集中在1：1的样子，但也有很高的，也有一个变异表达比其它的还要高3倍以上的。我们又验证了它这种可重复性，我们三次检测结果非常一致，方法非常可靠，你必须要非常可靠，才能会比较有效。

我们实验室也做很多临床研究，目前密歇根大学有一个非常大的临床数据库，我们可以检索病人的情况，甚至可以联系病人，让病人回来之后做试验，这对我们研究工作有非常大的帮助。

备注：内容根据速记整理，未经嘉宾本人审核。

大会信息：

名称：中国药物基因组学学术大会暨首届中国个体化用药-精准医学科学产业联盟大会

时间：10月27日至28日，上午9：00-12：00，下午1：45-6：00

地点：西安曲江凯悦酒店大宴会厅

主办：中共西安市委、西安市人民政府、中国药理学会药物基因组专业委员会、中国个药联盟

承办：西北大学、国家微检测系统工程技术研究中心、陕西基因检测精准医学示范中心、陕西佰美基因股份有限公司、陕西省国际医学交流促进会、西咸新区科统办

关键词：药物基因组学蛋白质组学