Nature:新型算法预测数十亿种药物-蛋白质相互作用

Drugable.com通过计算机分析,预测药物作用机制。
几十年以来,药物的研发过程通常就像试验与错误之间的一场较量,数以百万计的候选药物中最终只有极少数能够被成功研发出来。近日,研究者们利用计算机技术,为药物的研发开启了一个良好的开端。通过分析药物的化学结构,研究者们就可以了解它是否可能与某个生物学靶标(例如蛋白质)结合或“对接”。这样的算法尤为有用,有利于发现那些由于药物与结构相似的非靶标性蛋白质意外结合所引发的潜在毒副作用。
近日,研究者们提出了一个计算机模拟工作计划,拟以公共数据库中存储的药物信息和蛋白质信息为基础,对数十亿种可能的药物与蛋白质之间的对接进行评价。纽约大学(New York University)朗格医学中心(Langone Medical Center)的药理学家 Timothy Cardozo 曾经于 11 月 19 日参加了美国国立卫生研究院(National Institutes of Health)在马里兰州贝塞斯达举办的“高风险-高回报”研讨会(High Risk–High Reward Symposium),并在会上展现了这种计算机模拟技术;他指出,这是人类有史以来所做的最大的药物对接计算机模拟工作。这项工作最终创建了一个名为 Drugable (Drugable.com)的网站,该网站获得了美国国家医学图书馆(National Library of Medicine, NLM )的支持;虽然 Drugable 仍然处在测试阶段,但它最终会向公众开放,从而使研究者们仅仅根据化合物的化学结构,就能够预测它们如何在体内发挥作用以及在何处发挥作用(请参阅“药物信息挖掘”)。
药物信息挖掘
研究者们利用谷歌的超级计算机检测数十亿种药物-蛋白质相互作用。
Nature:新型算法预测数十亿种药物-蛋白质相互作用
Cardozo 承认道,计算机模拟仅仅是新药研发过程中的一个初始步骤。在预测了某种蛋白质是否能与化合物结合之后,药物研发者们必须在细胞中检测药物对这种蛋白质的作用,从而观察药物对蛋白质功能的实际影响,以及药物在不同情况下所需要的剂量等。随后再进行动物实验;如果幸运的话,研究者们接下来还可以进行人体试验。但是加利福尼亚大学(University of California)旧金山分校的计算生物学家 Brian Shoichet 指出,医药公司往往持有这些额外数据的专利。他指出,尽管一些公共数据库(例如由 NLM 进行维护的PubChem)持有药物与酵母细胞蛋白质相互作用的自动化检测结果,但是其中却包含有一些不准确的结果和假阳性结果。(汉恒生物:腺病毒-慢病毒包装专业服务供应商)
 
尽管如此,科学家们还是已经证实计算机模拟方法能够为药物研发提供一些捷径。2012年, Shoichet 与马塞诸塞州剑桥市诺华生物医学研究所(Novartis Institutes for BioMedical Research)的研究人员合作,联合开发了一种能够根据药物之间化学结构的相似性来预测药物副作用的算法。当研究者们对656种已获得批准的药物和73个生物靶标之间的相互作用进行测试时,他们发现该算法能够预测出数百种前所未知的相互作用,并且大约一半的预测结果都证实这些副作用是真的(E. Lounkine et al. Nature 486. 361-367;2012)。而 Shoichet 也指出,对于已知的药物,这类计算提供了一种快捷的方法来确认药物-蛋白质相互作用,以便进行深入研究。
Drugable 尝试预测那些未经试验的化合物是如何与体内蛋白质相互作用的,而这种预测工作更具挑战性。在建立 Drugable 网站时, Cardozo 研究团队从PubChem数据库和欧洲生物信息研究所(European Bioinformatics Institute)的ChEMBL数据库(该数据库收纳了数百万种公开型化合物的资料)中选择了大约60万个化合物分子,评价了这些分子与数据库中人类蛋白质的7000个结构“口袋”的结合能力强弱。计算领域的巨头谷歌(Google)向研究者们提供了相当于一亿个小时的超级计算机处理器时间,协助他们完成这项庞大的工作。
该研究团队提出了利用对接分数对40亿多个潜在的药物-蛋白质相互作用的强弱程度进行排序。随后,该研究团队将自己预测的靶蛋白与 NLM 基因表达综合数据库(Gene Expression Omnibus)中的靶蛋白进行了相互参照,从而表明不同蛋白质编码基因在体内的表达部位。 Cardozo 指出,这使得研究者们可以预测药物发挥作用的可能部位:如果 Drugable 发现某种药物与某个部位中高表达的蛋白质之间存在着相互作用,那么这种药物就很有可能会对这种组织发挥作用。
诺华研究所的研究员Jeremy Jenkins指出,多年以来医药公司一直都在开展类似的计算机预测工作。但是他也指出:诺华研究所虽然拥有一个包含150万种公共型化合物和专利型化合物的文库,但却从来没有像 Drugable 那样,一次性分析过那么多种蛋白质和药物。
Cardozo 希望 Drugable 能够在抗精神病药物的评价方面提供特殊的帮助,因为此类药物通常都以难以衡量的方式发挥作用。作为示范, Cardozo 研究团队采用 Drugable 算法对两种常常被用来治疗精神分裂症的药物——氯氮平(clozapine)和氯丙嗪(chlorpromazine)进行了靶标相互作用的预测。
正如所预期的那样, Drugable 预测结果表明两种药物与神经递质羟色胺(serotonin)和多巴胺(dopamine)的受体的结合能力最强,而这两种神经递质受体通常表达于进行高级信息处理的大脑区域中。但是 Drugable 发现,也可用于治疗情绪障碍性疾病(如抑郁症)的氯氮平能够强烈地结合于一种名为DRD4的多巴胺受体,而这种特殊的受体主要表达于大脑的情绪调节区域——松果体(pineal gland)中。
该研究团队也发现,氯氮平能够与大脑中调节唾液分泌区域内的受体结合;而唾液分泌过多恰恰是氯氮平的一种已知的副作用。虽然在之前就有研究者从生物化学的角度对氯氮平的情绪调节和唾液分泌作用进行了解释,但是 Cardozo 认为 Drugable 就能够用于揭示最合理的药物作用机制。(文章来源:生物360
原文检索:
Sara Reardon. Project ranks billions of drug interactions. Nature, 26 November 2013; doi:10.1038/503449a