【摘 要】
:
如何在发放贷款前有效的评价和识别借款人潜在违约风险,计算借款人的违约概率,是现代金融机构信用风险管理的基础和重要环节,也是数量经济学、金融学等领域中的研究热点问题
论文部分内容阅读
如何在发放贷款前有效的评价和识别借款人潜在违约风险,计算借款人的违约概率,是现代金融机构信用风险管理的基础和重要环节,也是数量经济学、金融学等领域中的研究热点问题。现有的贷款违约数据大部分都是非平衡的,以往的研究并未足够注意这一特征也就重视这一问题的深入研究,本文主要研究如何借助非平衡数据分类的思想对银行等金融机构的历史贷款数据进行分析,预测贷款违约的可能性。对于非平衡数据问题,采用基于数据平衡的方法构造随机森林;针对数据较大的问题,采用具有并行特性的随机森林算法。基于上述研究,本文提出了一种改进的带权重的并行平衡随机森林算法(WPBRF)。WPBRF算法在构造随机森林的每个决策树的同时利用OOB数据估计该决策树的预测性能,并据此赋予每个决策树不同的权重;此外,WPBRF算法利用了随机森林算法的可并行计算的特点,减少了单个决策树的训练时间。实验结果表明,WPBRF在准确率和平衡准确率等方面超过了SVM、KNN、C4.5等常见分类算法和随机森林算法。此外,利用随机森林的并行性的WPBRF算法大幅降低了算法的学习时间,提高了算法的执行效率。
其他文献
一国或地区的经济发展,不再仅仅停留在单纯意义上的追求经济总量的增长,除了包括经济增长的因素外,还应包括诸如经济增长质量、经济结构变动以及社会发展和人民生活水平变化等更
本文是对高中历史必修Ⅱ中“中国近代经济史”部分的教科书编写及教学问题所做的一项专题研究。全文共分为三章,加上绪论和结语共五个部分。绪论部分主要介绍了选题的缘起、
本文从衡阳市基础设施项目融资出发,分析衡阳市目前项目融资的现状,并对此提出了政策建议。本文介绍了政府债券、商业银行贷款和城投债券融资方式,同时介绍了英国、日本、美
目的:在认真研究国内外有关满意度理论和实践发展的相关文献的基础上,用满意度测评模型,以广州市大学生医疗保险参保人员为调查对象,运用满意度调查量表进行广泛性的问卷调查,以相
随着信息化和互联网的发展,高维数据在社会各领域不断涌现,如贸易交易数据、Web文档、病理诊断数据、多媒体数据及物流系统数据等等。总体来讲,这些数据都是半结构或者无结构
研究背景宫腔粘连(intrauterine adhesion, IUA)是指各种因素所致子宫内膜基底层损伤后,宫腔和(或)宫颈管的相互粘连。Asherman于1948年首次系统地详细描述了29例流产后或产
2012年11月份召开的中国共产党“十八大”明确提出了我国建设海洋强国的战略目标。在十二届全国人大一次会议上,酝酿已久的海上执法体制改革终成定局。本次改革将海监、渔政
《明史·西域传》在《明史》中共有四卷,从三百二十九卷至三百三十二卷,五万余字,是正史《西域传》中字数最多,卷数最多的。它融汇了《明实录》、《大明一统志》、《明会典》
私募股权投资在我国发展迅猛,与此同时,由于其所关注的目标公司往往在未来市场、管理、技术等方面都存在很大不确定,这就大大增加了投资的风险,因此投资前的项目筛选和评价对
电力行业作为技术密集型行业和关系国计民生的重要基础性行业,需要优良的人力资源,来满足日益加剧的市场竞争的挑战。当前,传统的人事管理方法已经不能适应县级供电企业发展