基于PSO的个人信用评估组合预测模型

来源 :经济研究导刊 | 被引量 : 0次 | 上传用户:lclanki
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:将组合预测模型用于个人信用评估,在两种单一统计模型的基础上,利用粒子群算法(PSO)求解组合模型的权重,并通过粒子适应度函数的设置来控制第二类误判的发生,构建了基于PSO的组合预测模型。应用结果表明,基于PSO的组合预测模型的分类精度高于单一统计模型,并且有效降低了第二类误判率,对于商业银行控制信用风险具有更好的适用性。
  关键词:粒子群算法;组合预测;个人信用评估
  中图分类号:F832.479文献标志码:A文章编号:1673-291X(2008)14-0083-04
  
  随着我国消费信贷市场的迅速发展,个人信用评估的作用日益增强。对于商业银行而言,个人信用评估就是通过考察反映消费信贷申请者的各种指标,对其按时还款的可能性进行全面的判断和评估,从而作出是否放贷的决定。在西方发达国家,对于个人信用评估方法的研究不断发展而且日趋成熟,许多方法被应用到个人信用评估领域[1],包括线性回归、Logistic回归等统计方法以及以神经网络为代表的人工智能方法等。我国现阶段仍未建立起完善的个人征信体系,各商业银行没有一套科学合理的个人信用评估方法,这种状况严重制约着我国消费信贷的发展。因此,建立适合我国国情的个人信用评估模型是很有意义的。本文将组合预测模型用于个人信用评估,并利用粒子群算法[2](Particle Swarm Optimization,PSO)来求解模型中的权重,建立基于PSO算法的组合预测模型,并与单一模型进行对比,考察模型的适用性。
  
  1理论背景及模型构建思路
  
  1.1组合预测的基本原理
  组合预测是将各种预测加权重组而得到结果,Clemen曾指出,组合预测将成为预测研究的主流之一[3]。在组合预测理论中,按照集结各单项预测模型的方式大致可分为线性组合和非线性组合,其中,线性组合预测模型是研究最多、应用最广泛的[4]。线性组合预测的基本原理如下:
  1.2基本PSO算法
  1.3模型构建思路
  个人信用评估本质上是模式识别中的一类分类问题,将消费信贷申请者划分为能够按期还本付息和违约两类,从而作出接受或拒绝其信贷申请的决定。在信用评估的实践中通常存在着两类误判:第一类误判是将信用好的客户误判为信用差从而拒绝其贷款申请;第二类误判是将信用差的客户误判为信用好从而接受其贷款申请。一般来说,在银行和其他金融机构的实际操作中,后者给银行造成的损失更大。因此,运用模型进行个人信用评估时,在提高分类精度的同时,应当尽量控制第二类误判的发生。
  本文在个人信用评估中利用线性回归和Logistic回归两种统计方法分别建立单一预测模型,进一步构建基于二者的线性组合预测模型。在权重的求解上,本文尝试采用PSO算法搜索一组权重,为了使组合预测模型能够有效地控制第二类误判发生,通过粒子的适应度函数的设置使PSO算法向第二类误判降低的方向进行权重的搜索。最后通过与单一模型的分类效果进行对比,考察基于PSO算法的组合模型的适用性。
  
  2样本数据及预处理
  
  2.1样本数据
  本文所使用的数据来自深圳某商业银行的消费信贷数据库。分类(是否违约)的标准根据“违约次数”,即在分期偿付贷款时出现还款滞后或还款金额不足的次数进行判定。在国外的实践中,一般认为在上一年中违约次数超过4次,则认为该客户具有较强的违约倾向。本文采用相对严格的分类方法,即只要该违约次数大于0,就定义为违约。同时,将属性缺失较严重的指标剔出,最终选择的数据中包含10个解释指标,这些指标及量化方法列于文尾表1。
  对于这些数据,本文选择分层抽样的方法,将样本分为违约和未违约两类,为了降低数据不均衡对模型分类能力的影响,选择使两类样本个数近似相等。按照上述步骤,最终选择1 057个数据用于模型的建立和测试,并将其随机分为两部分:一部分528个样本,包括257个违约样本和271个未违约样本用于建立模型;另一部分529个样本,包括248个违约样本和281个未违约样本,用于测试模型的分类效果。
  2.2数据的归一化处理
  为了消除量纲的影响以及降低数据不均衡对模型分类能力的影响,本文首先将训练数据和测试数据进行归一化处理。对于本文所采用的10个解释指标,将其分成离散型变量和连续型变量两组。
  
  3模型的构建及应用
  
  3.1单一统计模型
  作为组合预测模型建立的基础,本文首先分别建立线性回归和Logistic回归模型。
  线性回归要求解释变量的分布只有服从一定的前提条件,才能得到较好的结果。在这些前提条件中,一个重要的假定就是解释变量之间不存在较强的相关性,即不存在多重共线性。因此,本文利用SPSS软件建立线性回归模型,为了消除解释变量之间的共线性对模型的影响,变量进入模型的方法选择逐步进入(stepwise)法,得到的结果为:
  回归方程调整的R2为0.651,对式(6)的系数进行t检验以及对式(6)进行F检验,结果均表明回归方程有效。将回归方程用于测试样本,并以0.5作为分类界限,即如果预测结果大于0.5,则将其判为未违约类,否则判为违约类,得到的预测分类结果列于表2。线性回归应用于个人信用评估存在着一个缺点就是:回归方程的右边取值可以从-∞到+∞,但等式的左边是一个概率,其取值范围只能在(0,1)区间内。如果等式左边变换成p的一个函数,它可以取任意值,则模型会更有意义[1]。Logistic回归正是在线性回归的基础上产生的。将概率p进行Logit变换,即y=ln,就克服了线性回归的上述缺点。利用SPSS建立Logistic回归模型,变量筛选的方法选择Backward: conditional(以假定参数为基础作似然比概率检验,向后逐步选择自变量)的方法,本文得到的Logistic回归方程为:
  其中:分别表示未违约和违约样本总数;y和y分别表示网络的实际输出和期望输出;M是一个放大系数,是为了保证适应度的变化比较明显,这里取为100;k是一个变量,为了控制个人信用评估中造成损失较大的第二类误判,本文将其设置为大于1的常数,引导种群向第二类误判降低的方向进化,如果k取值过大,虽然会降低第二类误判,但会使第一类误判增加,从而造成总的误判增加。通过对不同数值的试验,最终模型中k取为10。
  将线性回归与Logistic回归模型在建模样本上的预测结果作为输入向量,建立基于PSO算法的组合预测模型,PSO算法在权重搜索过程中,其最优粒子所对应的适应度函数值的变化如右图1所示。
  PSO算法经过500次的迭代,搜索得到的最优权重为
  因此,本文求得的组合预测模型为
  将线性回归和Logistic回归模型在测试样本上的预测结果代入组合模型(14),并以0.5作为分类界限,得到的预测分类结果见下页表2。
  
  4结果分析
  
  下面分别从分类精度与两类误判两方面进行单一模型与基于PSO算法的组合预测模型的对比分析。
  从分类精度的对比可以看出,在建模样本和测试样本上,基于PSO算法的组合预测模型高于线性回归和Logistic回归模型,说明组合模型由于结集了各种单一模型的优点,用于个人信用评估中较单一模型具有优势。
  从两类误判的对比可以看出,在建模样本和测试样本上,组合预测模型在第一类误判方面得到了与Logistic回归相同的结果,高于线性回归模型。但在第二类误判方面,组合模型是三者中最低的,有效地降低了第二类误判的发生。两种单一统计模型的第二类误判都高于第一类误判,说明在实际中违约类客户的特征较未违约类客户的特征更为复杂,但通过PSO算法中粒子的适应度函数的设置,在第一类误判没有增加的情况下,实现了第二类误判的进一步降低,说明本文中PSO算法的适应度函数的设置是有效的,对于实践中规避信用风险的要求具有更好的适用性。
  
  5结论
  
  本文将组合预测模型用于个人信用评估,在构建线性回归和Logistic回归两种单一统计模型的基础上,构建了基于PSO算法的组合预测模型,利用PSO算法的全局搜索能力求解组合预测模型的权重,并利用粒子的适应度函数来控制第二类误判的发生。通过实证研究,本文得出以下结论:(1)组合预测模型的分类精度高于两种单一统计模型,因此,从提高分类精度的角度考虑,运用组合预测模型进行个人信用评估是具有优势的。(2)通过PSO算法中粒子的适应度函数的设置,组合模型在第一类误判没有增加的情况下,实现了第二类误判的进一步降低,对于商业银行控制信用风险的意义更为重要。
  
  参考文献:
  [1]Lyn C. Thomas. A Survey of Credit and Behavioral Scoring: Forecasting Financial Risk of Lending to Consumers [J]. International
  Journal of Forecasting, 2000,(16):149-172.
  [2]Kennedy J, Eberhart R C. Particle Swarm Optimization[A]. Proceedings of IEEE International Conference on Neural Networks
  [C].Perth: IEEE Piscataway, 1995:1942-1948.
  [3]Clemen R T. Combining forecasts: A review and annotated bibliography[J]. International Journal of Forecasting, 1989, (5): 559-
  583.
  [4]马永开,唐小我.线性组合预测模型优化问题研究[J].系统工程理论与实践,1998,(9):110-115.
  [5]Shi Y H, Eberhart R C. Parameter Selection in Particle Swarm Optimization [A]. Proceedings of the Seventh Annual Conf. on
  Evolutionary Programming [C]. New York: Springer-Verlag, 1998: 591-601.
  [6]Shi Y H, Eberhart R C. A Modified Particle Swarm Optimizer [A]. IEEE International Conference on Evolutionary Computation
  [C]. Anchorage, Alaska: IEEE Press, 1998:69-73.
  [7]周家林,段正澄,邓建春,等.基于粒子群算法的神经网络优化及其在镗孔加工中的应用[J]. 中国机械工程,2004,15(21):
  1927-1929.
  [8]Shi Y H, Eberhart R C. Empirical study of particle swarm optimization [A]. Proceedings of Congress on Evolutionary Computation
  [C]. Piscataway: IEEE Service Center, 1999:1945-1950.
  Combining Forecast Model Based on PSO for Personal Credit Scoring
  YIN Shunag, JIANG Ming-hui
  (Administration College, Harbin Institute of Technology, Harbin 150001, China)
  Abstract: This paper used combining forecast model for personal credit scoring. Based on two statistical models, this paper constructed a combining forecast model using particle swarm optimization (PSO) to search the combining model's weights and using particle's fitness function to control the type II error rate. The application results indicate that the combining forecast gets higher accuracy with lower type II error rate on training samples and testing samples. The combining forecast model based on PSO presents more applicable for commercial banks to control the credit risk.
  Key words: particle swarm optimization; combining forecast; personal credit scoring
其他文献
摘要:校园文化对于受教育者全面发展,以及创建提升素质教育氛围有着不可低估的作用。讨论校园文化应当关注其功能及其作用的发挥。校园文化在学校文化建设、教书育人等方面一直扮演着重要角色。实践中,在营造健康向上校园文化氛围的同时,更应当让校园文化发挥促进学习的功能,校园文化最重要的属性应是学习功能。因此,设计、营造校园文化必须将重心放置在促进学生学习方面。  关键词:校园文化;学习型;学习氛围  中图分类
期刊
摘要:NGO作为与市场和政府并列的第三支力量在环境保护领域发挥着重要的作用。从NGO在环境领域发挥作用的理论根源入手,分析了NGO在主要发达国家和我国环境保护中的作用,并预测了我国环境领域NGO发展的趋势。  关键词:NGO;环境问题;政府失灵;市场失灵  中图分类号:C23文献标志码:A文章编号:1673-291X(2008)18-0241-02    仅仅依靠市场和政府是无法从根本上解决环境问
期刊
目的:
  贝复新(Recombinant Bovine Basic Fibroblast Growth Factor Gel,重组牛碱性成纤维细胞生长因子凝胶)和易孚(Recombinant Human Epidermal Growth Factor Gel,重组人表皮生长因子凝胶)是临床中常用的两种促进伤口愈合的药物,本实验将对口腔颌面外科手术的患者应用以上两种药物,观察和评价患者术区切口的愈合以及瘢痕形成情况,比较两种药物的差异,为临床用药提供参考。
  方法:
  选取我院口腔颌
目的:随着生活水平的不断提高,为了获得更悦人的相貌而寻求正畸治疗的人越来越多。微笑,是人际交往中一个具有重要影响的因素,是人与人面对面交流的敲门砖,是表达情绪的一种独特语言。微笑时上下唇的位置;牙齿和牙龈暴露的程度;牙齿的形态、颜色、高度、排列;左右的对称与平衡以及各因素的相互作用,均潜移默化的影响着微笑的魅力。微笑是否吸引人取决于人们的主观因素评价,而正畸医生和患者本身对美丽微笑的理解与评判不尽相同,本研究通过调查问卷,调查专业正畸医生与非专业人士,对不同下唇弧线与不同上前牙垂直距离综合后的微笑评分的差
背景和目的:口腔癌是头颈部常见的恶性肿瘤,约占全身恶性肿瘤的4%。随着人口老龄化的加剧及口腔局部刺激因素的增加,口腔癌发病率在世界范围内呈上升趋势。但由于口腔癌解剖部位、患病年龄的不同,所对应的治疗也不相同。对于解剖位置与预后的相关性,不同学者的观点也不尽相同。所以解剖因素是否是影响口腔鳞状细胞癌(Oral Squamous Cell Carcinoma,OSCC)的预后指标之一,目前仍然存在争议。本文旨在通过大样本回顾性研究,探究解剖因素对OCSS患者预后的影响。
  方法:基于美国国家癌症研究所
摘要:社会和谐是我国政府施政的价值目标,政府信用直接关系着政府的合法性,是实现政权稳定、政治民主,促进和谐社会政治文明发展的主导力量。政府信用还是社会信用体系的基石,能保证社会主义市场经济的良性运行,是促进和谐社会的经济发展,建设物质文明,实现人民生活相对安康的重要支撑。政府信用也是塑造信用文化,建设精神文明,促进和谐社会文化发展和推动资源合理利用,建设生态文明,促进环境和谐的保障力量。应从树立善
期刊
摘要:改革开放30年以来,我国财政预算规模经历了很大的变化。通过对这30年预算报告的分析可以看出财政预算绝对规模逐年上升,财政预算收支占GDP的比重则呈U型变化。结合改革开放的历程,得出我国财政收支规模变化与改革有密切关系的结论,财政收支规模的变化源于经济体制的改革。  关键词:改革开放;财政预算收入;财政预算支出;变化  中图分类号:F810.2文献标志码:A文章编号:1673-291X(200
期刊
摘要:亚当·斯密的经济学说之核心是自然演化论,即历史进程不可以人为预先设计。对此论点学术界有很多曲解。因此,正确理解亚当·斯密理论对破解当今世界经济理论有很大帮助。亚当·斯密的理论是:分工并来自有预见性的智慧设计,是基于人类天性的必然的自然演化的结果。这一论点是说事物的发展是不以人的意志为转移的。从有限理性的英国式自由主义视角出发,描绘了这位经济学家的理论本意。  关键词:英国式;自由主义;有限理
期刊
摘要:自20世纪90年代以来,产业集群在我国农村迅速发展,对地方经济的发展起到了重要的推动作用。由于各地自身因素的不同,产业集群的发展路径也有所不同。江苏省戴南不锈钢产业和丁伙花卉产业是两种比较典型的模式。首先分析戴南与丁伙的产业集群概况,然后,在此基础上寻找到两种模式产生与发展的共性,总结出选择农村地区发展产业集群应遵循的一般原则,即产业关联度原则、经济效益比较原则、市场导向原则和动态比较优势原
期刊
摘要:目前,境内即期市场的影响力仍对人民币汇率起决定性作用,但是,人民币汇率定价的主导权旁落的担忧并非杞人忧天,一旦CME成为人民币衍生工具交易的中心,人民币汇率问题将被进一步放大,对汇率预期产生严重影响,并反过来影响进出口和资本流动等实际经济交易。发展和完善境内外汇市场,更好地使境内实际的外汇供求以及汇率预期在市场上得到更好的反映,这才是掌握人民币汇率定价主导权的关键。  关键词:衍生金融工具;
期刊