酶

注册

 

发新话题 回复该主题

人工智能药物研发科学院院士蒋华良基于 [复制链接]

1#

责编

酶美

由组蛋白乙酰转移酶(HATs)和组蛋白脱乙酰酶(HDAC)催化的组蛋白及其他蛋白质的可逆乙酰化是细胞调节的主要表观遗传机制之一。当前HDAC抑制剂已经作为抗癌药应用于临床,但HAT仍然缺乏高选择性、有效的小分子抑制剂。在HAT中,E1A结合蛋白(p)及其旁系同源的CREB结合蛋白(CBP)作为关键转录共激活因子在大量的细胞过程中发挥重要作用,其功能异常调节与多种人类疾病,例如癌症、心脏病和亨廷顿氏病密切相关。因此,发展高选择性、有效的p/CBP抑制剂具有很高的临床实用价值。

近日,中国科学院上海药物研究所蒋华良课题组与周兵课题组、罗成课题组通力合作,基于深度学习辅助药物设计策略,设计发现了高选择性、有效的p/CBP组蛋白小分子抑制剂,研究结果于近期在线发表于JournalofMedicinalChemistry,题为DiscoveryofHighlyPotent,Selective,andOrallyEfficaciousp/CBPHistoneAcetyltransferasesInhibitors。

人工智能(AI)技术,尤其是深度生成模型等新方法在新药研发的denovo分子设计上显示出了光明的前景,在hit-to-lead结构改造以及化合物成药性优化等其他难点问题上也将发挥越来越重要的作用。通过利用自然语言处理中的统计语言模型和迁移学习思路,本文作者设计生成了靶向p/CBPHAT分子集中库,并通过一系列的系统优化得到了一组高效的p/CBP抑制剂(图1)。与现有AbbVie开发的A-相比,本文报道的新化合物B在分子和细胞水平上具有明显的活性优势,更为重要的是,口服给药的B在人类肿瘤动物模型上也取得了剂量依赖性抑制肿瘤生长的显著效果。

图1AI辅助的新型p抑制剂发现流程及生成的新型p抑制剂B。(A)AI辅助的新型p抑制剂发现流程。(B)B(蓝色)及其在p口袋的结合模式。

在AI模型构建上,文章作者使用了当前生成类模型中常用于自然语言处理问题的长短期记忆(LSTM)神经网络模型,构建了由3个LSTM层、3个Dropout层、1个TimeDistributed层和1个Softmax层组成的LSTM神经网络。LSTM作为典型的循环神经网络(RNN)模型,适合处理使用标准SMILES形式描述分子结构的生成问题,且其具有的门控结构也可以在SMILES式较长的情况下学习到分子的特征性质。

为了训练神经网络模型设计和生成活性化合物结构的能力,作者首先使用了ChEMBL数据库中所有人源蛋白靶标的活性分子对LSTM模型进行预训练,然后利用已报道的p/CBP抑制剂,以及潜在具有PPI调控功能的大环类化合物等多种先验数据对LSTM模型进行了进一步的微调。图2显示了靶向p/CBPHAT抑制剂分子生成算法模型的训练过程(图2)。

图2靶向p/CBPHAT的LSTM分子生成模型

为进一步获得可用于合成及后续生物活性实验的性质较好分子,作者通过3个规则对生成的分子库进行了排序和筛选:(1)至少满足Lipinski五规则的4项以上;(2)结构不能过于复杂(SAScore≤4.5)和(3)具有良好的分子对接分数。在对模型生成的分子库实施排序后,作者筛选了对接分数最高的前20个分子进行重点分析(图3),作为后续合成和实验的候选分子库。可以看出,筛选后得到的20个候选分子主要散布在已报道的p抑制剂周围,少数的分子距离较远,这也进一步验证了该生成模型可以在保持现有分子特征的同时兼顾一定的新颖性(图4)。

通过上述筛选过程,文章作者选择化合物B进行后续合成测试。该化合物经放射性乙酰基转移酶实验确证可对p表现出高度有效地抑制活性,其IC50值为10nM。从B出发,文章作者快速获得了一组高效的p/CBP抑制剂,其中B的分子水平活性比现有AbbVie开发的A-强30倍左右,在多种血液癌和AR+前列腺癌细胞上都显示出明显优越的抑制活性。更为重要的是,该化合物在动物体内模型上也显示了良好的药效。整体而言,这一工作显示了AI模型在新型p抑制剂的快速设计优化过程中重要的指导作用,研究结果也为新型抗肿瘤药物的开发提供了思路。

据悉,中国科学院上海药物研究所的杨亚玺研究员为论文的第一作者,博士后李召军和博士研究生张汝康为共同第一作者。

分享 转发
TOP
发新话题 回复该主题