新药研发错综复杂,可谓是横看成岭侧成峰,没有人能深刻了解这个过程涉及的所有步骤。新药的开发大概可分为发现、临床前开发和临床开发三个部分。本文将简单介绍新药的发现,即发现药物分子的过程。
新药的发现需要几个基本的条件。第一,想找到任何东西,这个东西首先得存在,如果这个东西根本不存在,再先进的技术也不可能找到它。准确估计一个药物存在的可能性是衡量一个团队研发水准的主要指标之一。其次,如同破案一样,一个有用的线索十分重要。线索化合物质量越高,最后发现新药的机会越大。神农尝百草式的药物发现既不符合现代社会的伦理规范,也消耗太多的人力物力。现在的药物发现是通过对先导物进行极其复杂的优化改造实现的。最后,和完成任何复杂任务一样,团队的执行力也十分重要。做同样的项目,用同样的优化指标,执行力强的团队可以更快的以更低的成本发现药物,从而享有首创药物的市场优势。
1 靶点的发现和确证
估计一个药物是否存在,严格讲属于哲学范畴,似乎没有什么实际意义。如果找到了一个药物,当然证明了它存在,但此时这个信息已无意义。如果没找到,也无法证明它的不存在,因为理论上可能存在的小分子化合物可达1060个之多,不可能一一测试(据估计如果只合成一个分子的上述所有化合物就会用尽太阳系的所有原子)。但实际工作中科学家们用更实用的办法估计一个药物有多大可能存在。通常这个过程涉及两个方面:一是要估计调控一个生物信号传导途径或一个蛋白活性是否会停止或逆转所关心的疾病,学术上这个任务叫做靶点验证;另一方面需要估计在目前的技术水平和可利用资源限制下能否找到药物水平的化合物,术语是成药性评价。
发现能减慢或逆转人类疾病的生物途径和蛋白非常困难,业界很多人认为这是新药发现的核心瓶颈。这和警察侦破一起谋杀案有些类似。案发现场有很多人,凶手是可能在里面,但也有很多人是赶来的救护人员,大部分则是和案件毫无关系的旁观者。除了象武松那样每次都在墙上留下“杀人者武松也”字样的绿林好汉,多数情况判断哪个是真正的凶手并不容易。疾病也类似,病人的很多蛋白表达水平可能和健康人不一样,但区分哪个是导致疾病的蛋白,哪些是通过体内反馈机制适应、抗衡疾病的蛋白,哪些是旁观者,和破案一样非常困难。尤其是制药工业最关注的大众慢性病,在分子水平基本都是很多疾病的组合,导致疾病状态的蛋白可能因人群而异,有时可能需要多个蛋白的非正常表达才能造成疾病的发生,发现这类疾病的病因就更加复杂。还有一些疾病如阿尔茨海默或精神分裂症,病变可能在出现症状之前很长时间就已经发生,这相当于凶犯逃离现场后才发现受害者,这种情况下找到罪魁祸首就更加困难。但是现在科学家可以通过多方面数据来估计一个蛋白在疾病中的作用,虽然成功率还很不理想。自人类基因组破解后,学术界考察了很多基因及其表达的蛋白和疾病的关联,但极少有成功的。据专家估计,目前为止真正能通过药物改变其功能而改善人类疾病的蛋白数量只有300~400个。
一个可能造成疾病发生的靶标蛋白一旦确立,科学家需要从多方面验证这个蛋白到底和疾病有多大关系,这个过程叫靶点确证(target validation)。因为开发新药十分昂贵,所以在开始新药研发项目之前对该靶点在疾病中作用的研究非常重要。靶点确证这个说法本身并不严格,因为一个靶点是否能算确证靶点(validated target)只有在调控这个靶点的药物显示疗效和安全性时才100%确定,而不是在新药研发开始之前。对于首创药物(first in class),现在文献中确证靶点的内涵模糊,但一般包含下面两层含意中的一个或两个:一个可能是某些人群由于一个基因变异而不患某个疾病,所以抑制这个基因表达的蛋白可能治疗和它相关联的疾病;另一个可能是通过某些技术改变动物的基因或蛋白水平导致和治疗人类疾病类似的生理变化。前者是靶点确证最可靠的办法,如现在制药界最热门的靶点之一PCSK9,缺失这个蛋白的人血脂和心脏病发病率均低于正常人并且无其它并发症,而这个蛋白过渡表达的人则有高血脂和高于正常人群的心脏病发病风险,根据这些数据可以比较肯定预测抑制PCSK9的药物可以降血脂并降低心脏病发病率。但遗憾的是这种高质量的靶点廖若晨星。多数情况下科学家只能在动物模型中研究靶点的功能。常见的非药物调控方法包括基因剔出,siRNA, 反译短链核酸,中和靶点蛋白的抗体等技术。这个模式有两个关键的弱点使制药工业在很多所谓确证的靶点投入大量人力物力后最后以失败告终。一是动物和人的生理有很大区别,疾病模型和疾病本身也有很大区别;二是这些非药物手段和药物本身也有很大的区别。这两个缺陷是目前全球以靶点为中心新药研发模式的主要问题,严重影响新药研发效率。
雪上加霜的是有关靶点发现和确证的科技文献中有大量假阳性报道。安进的科学家发现在53个重大癌症研究结果中,只有6个能被他们重复。拜尔的科学家发现他们有近2/3的新项目由于无法重复文献实验结果而中止。找到可靠的靶点如同淘金者找到优质金矿,即使技术落后一点也能淘到一些金子。但如果矿里没有金子,技术再先进,工作再努力也是枉然。
有了可靠的靶点还需判断找到既能和这个靶点结合又能在人体内到达这个靶点的药物分子的可能性。有些蛋白在体内受到一些生物屏障如细胞膜(细胞内靶点)和血脑屏障(中枢神经系统靶点)的保护,只有既能穿过这些屏障又能和目标蛋白结合的化合物才有可能成为药物。能够穿过生物屏障是所谓类药化合物的一个重要性质。一个蛋白如果能和类药化合物高强度地结合则被认为是可成药性蛋白(druggable protein)。判断一个蛋白的成药性相对容易,有不少根据蛋白活性口袋的结构特征估算其配体性质的方法。但实际上由于现在计算化学,合成化学以及筛选技术的发展,除少数几类蛋白如磷酸酶,内源性配体本身也是蛋白质的蛋白(蛋白蛋白相互作用)等,对于几乎所有其它靶点,科学家都有较大把握能找到相应的药物,前提是这个靶点确实和疾病相关。
2 先导物的发现
有了一个确证靶点之后,科学家下一步的任务是找到能选择性调控这个靶点功能、有足够活性的药物。除了一些细胞表面受体,多数情况下抑制靶点活性远比增加靶点活性容易,所以多数药物是蛋白抑制剂(但根据蛋白本身的功能可能导致生物传递信号的增强或减弱)。活性和选择性是两个相互关联、决定药物质量的关键性质。由于进化效率的压力,人体的蛋白是由少数几个类似模块通过不同的连接方式组合而成,所以每个蛋白都有不少结构相似但功能不同的亲戚。通常这些相似蛋白也有重要的生理功能,所以如果选择性不好通常会导致毒副作用。提高选择性的一个办法是增加活性(但增加活性并不能保证选择性)。一般药物不宜超过每日500毫克剂量,最好低于100毫克以避免干扰其它蛋白的功能。考虑到血浆蛋白结合,到达靶点蛋白的各种生物屏障等因素,一个药物的体外活性应该在1~100nM范围才能保证有效调控目标蛋白,当然例外是存在的,但这是比较合理的优化目标。
前面提到找到这样的药物需要一个好的线索,术语叫做先导物。当代药物研发先导物一般是通过高通量筛选的技术发现的。西方主要制药集团在过去几十年的时间里积累了大量的调控不同蛋白功能的小分子化合物。通过少数模块组成不同蛋白这个生命运作方式虽然给我们带来药物设计的选择性难题,但也使高通量筛选成为可能。虽然这些化合物是为以前不相干蛋白设计的,但由于几乎每个新蛋白都和过去研究过的某个蛋白有或多或少的亲戚关系,只要筛选足够的化合物总是能找到有一定活性的苗头化合物。一般跨国大制药集团都有50~300万的化合物储备,但由于筛选成本很高,如果靶点不是十分另类,10~100万化合物足以提供所需要的苗头化合物。
这些苗头化合物通常还不能叫先导物,因为活性、选择性、药代动力学性质(药物浓度在人体随时间、空间如不同组织变化的性质)还远不够理想。现在多数企业都会通过一个叫hit-to-lead(苗头变先导)的快速优化过程在短时间内找到一个可以在动物模型看到疗效和安全性信号的所谓先导物。苗头变先导这一步在以前的药物研发中不存在,是最近十几年才出现的。这一步失败的机率较低,即使苗头化合物的质量很差,优化到先导物的水平还是相对容易,只是有时这一步之后继续优化成药物的空间可能已经非常小,所以影响整个发现过程的成功率。先导物通常有足够好的活性,选择性和药代性质可以进行一些动物实验,在一定程度上能衡量一个靶点是否有在靶点确证工作中所预测的功能。如果这个先导物重复了非药物手段的治疗效果,团队对这个研发策略可靠性会有较高的把握,花更多人力物力优化这个先导物就顺理成章了。进一步优化一般要增加其活性,剔除所有不理想性质如安全性、毒性,直至找到最终的药物分子。
3 药物发现的主战场:先导物优化
先导物的优化是药物研究阶段(不包括剂型发现,生产工艺,临床研究等所谓开发活动)最耗时耗力,也是对判断技能要求最高的一步。这个过程的基本思路是通过改造先导物分子(增加,去除,替换先导物分子的某个部分)带来的性质变化总结所谓的构效关系,有时会使用计算化学,分子模型,晶体结构提供的有用信息,来指导下一个更好化合物的设计。
这个阶段需要全面改进先导物的分子缺陷,当代药物发现有时可能有20~30个指标需要同时优化,而分子改造牵一发而动全身,一个小的分子改动可以彻底颠覆一个化合物的某些性质,如药物化学家熟知的神奇甲基效应(magic methyl effect),指一个甲基(最小的分子零件之一)可以大幅度增加或降低一个分子的活性。其它微小变化也时常使千辛万苦优化得来的某些性质灰飞烟灭。分子设计是一种极其尖端的技能。
先导物优化艰难的另一面是庞杂数据的分析和判断。试想如果有20~30个指标需要优化,而每个优化指标的实验测定都有一定的假阴性、假阳性频率,每个指标对成药的重要程度未知,需要决策者客观判断,这样的过程相当复杂。先导物优化过程中经常出现不同数据组合得出不同结论的情况。受时间和资源的限制,不可能每个实验都反复重复以保证其可靠性,而有些实验存在不可消除的系统误差。每当出现数据不一致的情况时,那个幸灾乐祸的声音总会在你脑海里出现:“你选择了一个错误靶点!”
究竟是靶点错了还是实验数据不可靠?是再花点时间重复那个关键的阴性实验还是找借口降低那个数据对项目的重要性?关键的疗效实验量效关系混乱,是实验噪音太大还是体内正负反馈在起作用?当你最好的化合物不幸在大鼠有点心脏副作用,但你知道有一个已经上市的药物在这个模型中也有这个毒性信号,现在在人体却并无这个副作用时,是期望你也有这个运气还是继续优化以防10年的投入毁于一旦?你的团队已经合成了几乎所有有点希望的化合物但还是没有找到药物水平的化合物,是继续合成难度更大的化合物还是投子告负?所有这些问题每天都在考验一个团队的技能、耐心和意志。对于新靶点,只有约10%能找到可以进入临床的候选药物,而这些化合物只有10%能最后成功上市。即使是上市的药物也只有30%能为厂家带来利润。新药研发凿实无愧于“人类最复杂智力活动”这个称呼。
新药的发现错综复杂,发现确证靶点尤其关键。对于首创药物,靶点是否正确在找到药物之前永远是个致命的问号,整个过程总是令人提心吊胆。即使有幸找到有用的靶点,先导物的优化也是一波三折,如同过山车。大量的优化指标,实验数据的缺陷,竞争的压力,以及时间、人力物力的限制,要求很多决定要在数据不完整或不可靠的时候做出。需要说明的是新药疗效和安全性的确定是要通过严格的科学手段的,只是选择哪个化合物去做疗效和安全性评价不一定有严格的科学依据。这一点和科学研究有重要区别。科学探索是在已有的技术限制下通过创造性实验和对实验结果的深刻解析发现新知识,这些知识的可靠性是科学研究的核心要求。新药发现是在技术和资源的限制下估计哪个化合物最可能成为药物,至于整个发现过程是否科学则是次要的,新药可以是意外发现或幸运的猜测。新药发现的核心是以快于竞争对手的速度找到安全有效的药物。从这个意义上讲,新药发现更是一门手艺而不是一门科学。
本文来自于《中国医药技术经济与管理》,作者 赵红宇


