利用深度学习技术基于10-fold和mse预测化合物的水溶性文献综述

 2023-01-03 03:01

一、文献综述

水溶性是在药物发现过程中优化的主要生理化学性质之一,它与ADME-Tox(吸收,分布,代谢,排泄和毒性)的吸收和分布密切相关[1]。且水溶性和膜通透性是影响药物口服生物利用度的两个关键因素。作为药物最重要的性质之一,分子水溶性在药物发现领域受到越来越多的关注。由于人的血液超过80%都是由水组成,很少能吸收水溶性差的分子,因此,在药物发现管道中及早预测并鉴定出水溶性差的分子可降低失败的风险[2]。所以准确预测化合物的水溶性对于优化药物的口服生物利用度、药物发现研究等方面十分重要。

化合物的水溶性指的是常温下化合物在水中的溶解度(25摄氏度),水溶性直接影响活体中化合物的吸附[3]。在过去的几十年里,已经有大量硅片模型被开发来预测固有溶解度S(文献中有几种类型的溶解度:固有溶解度,热力学溶解度,表观溶解度,动力学溶解度等[1])。但是,基于早期的化学实验,常规的评价化合物水溶性的方法非常耗时。 2000年,Huuskonen等人提出了水溶性预测基于分子拓扑结构的多种有机化合物评价方法[4]。2001年,Tetko 等人提出电子状态指数法(E-State index method)评估水溶性化合物[5]。 2003年,Lind等人提出支持向量机(Support Vector Machines,SVM)来预测和评估化合物水溶性[6]。在2007年,随机森林模型由Palmer等人提出[7]来用于预测化合物水溶性。 2008年,Zhou等人提出了QSPR的方法使用分子指纹作为描述符来预测化合物的水溶性[8]。直到2011年,高通量数据的使用为预测郑博士提出的化合物的水溶性提供了一种新的思维方式。这种方法使溶解度评估不再局限于回归方法。

在过去的几年中,有许多机器学习方法被应用于研究化合物的水溶性,如人工神经网络(ANN),多线性回归(MR),支持向量机(SVM),随机森林(RF),贝叶斯正则化神经网络(BRNN)等。上面提到的方法是浅层架构,当样本和计算元素有限时,其复杂功能的表达能力有限;此外,复杂分类问题的生成能力也受到限制;虽然浅层机器学习方法得到了广泛的应用,但在实际应用中仍存在一些问题[3]。化合物水溶性的预测亟需新的技术手段支持,以提高效率并得到更准确有效的结果。近年来,深度学习的兴起与广泛运用为化合物水溶性的研究提供了新的方向与机遇。深度学习模型可以表示描述符与属性之间复杂的非线性关系。

随着机器学习研究的不断深入, 深度学习作为机器学习领域一个新兴研究方向, 逐渐成为研究者们关注的焦点[9]。深度学习通过建立类似于人脑的分层模型结构, 对输入数据逐级提取从底层到高层的特征, 从而能很好地建立从底层信号到高层语义的映射[10]。深度学习是一种高效的特征提取方法, 通过提取数据中更加抽象的特征, 从而实现对数据更本质的刻画[11]

深度学习网络结构是对人类大脑皮层最好的模拟,深度学习比浅度学习具有更强的表示能力,而由于深度的增加使得非凸目标函数产生的局部最优解是造成学习困难的主要因素。2006年,Hinton等人[16]提出的用于深度信任网络(deep belief network,DBN)的无监督学习算法,解决了深度学习模型优化困难的问题。在深度学习技术快速发展的今天,其于语音识别、图像处理等领域中的应用已趋近成熟。

现如今,深度学习技术正在如火如荼的发展,而其在药物发现中的应用也愈加重要。利用深度学习技术预测化合物水溶性会给我们带来全新的思路和更高的准确性。基于以上背景,本文决定对深度学习算法进行深入研究,在此基础上,构建水溶性预测的模型。解决特征提取片面、模型预测精度不够高的问题,为业界相关人员的药物发现提供参考。

二、拟研究、解决的问题及意义

1)研究深度学习CNN、DNN模型的架构及适用情况

2)研究利用深度学习的非监督学习进行化合物的特征提取

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。