开题报告内容:(包括拟研究或解决的问题、采用的研究手段及文献综述,不少于2000字)
1.选题目的和意义
传统的药物研发过程中,药代动力学性质的评价及优化往往在后期。因而大量小分子因为较差的性质导致临床实验后期失败,浪费了大量的研发费用。近年来,计算预测模型的构建,可以在合成前对化合物进行高通量评价,显示了很好的优势,降低了药代动力学性质引起的临床失败率。药物的小肠吸收性质是化合物进入人体血液的关键一步,尤其是口服药物。肠吸收不好则意味着药物很难发挥疗效。因此,我们拟通过搜集开源实验数据,构建肠吸收预测模型,为药物研发早期高通量评价化合物的小肠吸收性质提供有效的预测工具,为先导化合物的优化提供优势子结构指导。
2.文献综述
2.1 计算机预测ADMET性质
药物发现是一项十分复杂又花费巨大的系统工程,包括选择靶标的发现与确证,先导化合物的发现与优化,临床前及临床试验等过程[1,2]。然而大量候选药物在开发的最后阶段由于人体吸收、分布、代谢、消除和毒性(ADMET)性质不能达到要求而被淘汰,使得制药公司蒙受巨大损失的同时也拖慢了药物的研发进程。因此,在药物研发的早期即对其ADMET性质进行筛选与优化能在很大程度上减少研发过程的损耗。近年来,虽然基于各种媒介的高通量体外ADMET筛选方法得到了大量发展,但体外ADMET实验耗时久、花费高,不能很好的满足药物筛选和先导化合物优化的要求[3]。
随着计算机技术的发展,运用计算机模型预测药物ADMET性质的方法越来越多[4,5],这些方法能有效的降低研发过程的损耗,缩短时间并起到一定的指导作用。计算机模拟预测药物ADMET的方法主要分为两类:分子模型和数据模型。本课题采用的是数据模型。经典的数据模型就是定量构效关系(QSAR)模型,由Hansch等早在十九世纪六十年代引入药化[6,7]。传统定量构效关系研究是利用分子描述符,将分子结构中某些特定方面转化为数学度量,并采用统计学方法建立分子描述符与分子性质间的数学关系,进而确定分子结构与生物活性或物理化学性质间的映射关系[8](图1.1)。
图1.1 基于描述符的定量构效关系研究示意图
最近,沈杰等[9]发展了一种新的预测方法。其根据预定义的子结构字典采用分子指纹的方法表征分子(图1.2),应用机器学习中的支持向量机(SVM)算法建立数学模型,并引入信息增益(IG)分析来体现对某分子性质贡献最大的子结构,对SVM算法得出的结果给出一定的药物化学方面的解释。该方法绕过了分子描述符,在分子结构与性质之间建立了直接的联系。
