基于随机森林算法的个人信用风险预测分析文献综述

 2021-09-25 20:19:02

全文总字数:6136字

毕业论文课题相关文献综述

1.1研究背景及意义:

近十年来,在经济高速增长、消费内需的不断扩大以及城镇住房制度改革等相关政策的带动下,个人信贷需求得到长足发展。然而,尽管目前我国个人信贷业务发展比较迅速,信贷模也不断扩大,但从国际比较来看,我国在个人信贷领域的发展仍处于初始阶段。在发展的过程中仍然存在着个人信贷结构不合理、信贷违约风险较高、个人信贷发展业务地区性失衡、征信体系覆盖面小以及个人信用评分方法单一等问题。从长远角度看来,这些问题也进一步制约着我国个人信贷业务的健康成长。随着银行各种贷款业务的推出和人们日益膨胀的物质需求,银行业绩得到突飞猛进的提高,不良贷款也就是贷款违约的概率也随之激增。

在这些问题中又以能够给开放个人信贷业务的商业银行带来直接经济利益损失的个人信贷违约风险问题最为棘手。在目前的情况下,规避此类风险的最有效的方法就是通过借贷人向银行申请贷款时提供的信息对其自身的信用情况进行总体的评价,即个人信用评分。

1.2国内外研究现状

信用评估是一个注重实效的领域,其目的是利用现有的样本数据建立模型,利用此模型对未来申请人的信用行为进行预测,从而区分出好客户和坏客户。这里预测的精度是非常重要的,因为许多情况下即使预测的准确性只提高一点点,也会使银行的损失减少很多。因此,伴随着整个信用评级的历史发展过程,大量的分类技术被应用到信用评估领域,信用评分模型层出不穷,并在实际应用中不断得到改进。这些技术包括传统的参数统计方法、非参数统计方法以及一系列的人工智能模型被引入到个人信用评估领域中。

1.2.1国外研究情况

国外个人信用评估研究始于20世纪40年代,Fisher(1936)[1]最早在统计学中提出按照不同的特征划分为不同的分组思想。DavidDurand(1941)[2]意识到在个人信用评估中可以用类似的方法来区分好的贷款和坏的贷款,以此来评估预测个人的信用状况。在线性判别模型中以Beaver(l966)[3]的单变量模型和Altman(l968)[4]的Z-Score模型影响最为广泛。年Altman(1977)[5]又对Z-Score模型进行了修正和扩展,建立了ZETA评分模型。Wiginton(1980)[6]最先Logistic回归应用于信用评分的效果做了分析,Steenackers和GoovaertsC(1989)[7]则做了相关后续应用研究。Cramer(2004)[8]则对Logistic回归方法的几种变形进行了研究,认为边界logistic回归分类精度更高。Logistic回归因其前提假设少,稳定性高的优点成为了信用评分领域使用最广泛的建模方法之一。

近年来,数据挖掘在信用评估方面也得到了广泛的应用。决策树是一种非参数统计方法,Makowski(1985)[9],Carter和Catlett(1987)[10],Lee(2006)[11]将对决策树方法在信用评分中的应用进行了研究并取得了令人满意的效果。最近邻法也是一种非参数统计方法,它无需对特征变量的概率分布做出约束。Chatterjee和Barcun(1970)[12]最先将最近邻法应用于建立个人信用评分模型。Hand(1981)[13]比较了最近邻法和决策树方法在识别家庭贷款风险方面的效果,结果表明最近邻法能够很高的预测精度。贝叶斯网络由Pearl(1988)提出,是目前不确定知识表达和推理领域最有效的理论模型之一。Hsieh等的研究表明贝叶斯网络能直观地揭示属性和违约概率间的关系,具有良好的解释性。

神经网络是一种模仿人类大脑神经网络行为特征,进行分布式并行信息处理的智能化信息处理技术。Odom首次将神经网络方法引入信用风险评估

,之后人工神经网络的混合算法广泛应用于信用评估中。PeterZhang将神经网络与贝叶斯网络、判别分析相结合,得出新的分类模型。遗传算法是一种随机搜索优化算法,它通过模仿生物的进化过程来获得最优决策。Fogarty和Ireson(1993)最先将遗传算法应用于个人信用评分,随后Michalewicz对运用遗传算法构建个人信用评分模型作了进一步的探讨。支持向量机(SVM)以训练误差作为优化问题的约束条件,以置信范围的最小化为其优化目标,求得唯一的、全局最优解。Baesens和Gestel最早将支持向量机方法运用于信用评分领域,他们认为支持向量机方法明显优于线性回归和神经网络方法。Schebesch和Stecking,Bellotti和Crook]做了后续研究。PauliusDanenas等人研究了一系列基于支持向量机的信用风险评估模型,包括线性SVM,随机梯度下降SVM,LibSVM,核向量机(CVM),球向量机(BVM)等,研究表明不同的SVM分类器产生类似的结果,但选择合适的分类器及其参数仍然是一个重要的问题。PauliusDanenas等人利用基于GA和PSO优化SVM的信用风险模型,并验证了其在预测破产过程中要比判别分析方法效果好。虽然支持向量机在个人信用评分领域具有良好的应用前景,但也存在不少问题,如支持向量机的核函数选择及最优参数设置,这需要依赖于专家知识和经验,无确定的公式可供计算。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。