基于机器学习算法的银行用户信用风险分析

来源 :南开大学 | 被引量 : 0次 | 上传用户:xiandaoisme
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着金融行业的快速发展,各种各样的信用消费方式已经深入到人们的生活之中。在信用消费群体规模快速扩张的同时,各大金融机构也正面临着严峻的信用风险问题。目前信用风险已经成为影响银行未来稳定发展的重要因素之一,因此对用户信用风险的分析研究能够帮助银行有效地识别出潜在的信用欺诈用户,减少银行的损失。本文选取了厦门国际银行用户的真实借贷数据作为文章的研究对象。数据集的特征变量涵盖了用户个人基本信息、历史借贷行为信息等。在前期准备阶段本文对数据集进行了预处理,主要包括异常值检测、缺失值填充、类别特征编码等。特征工程阶段,本文基于Python可视化工具对所研究数据集的特征变量进行分析,从用户地区编码、学历编码等特征中挖掘出了一些潜在的用户欺诈行为信息并构建了相关的特征变量。随后根据相关系数法、特征重要性排序法筛选了40个特征作为后续模型的输入数据,并采用SMOTE-Tomek Links方法对数据进行了平衡处理。在模型方面,本文采用了支持向量机、随机森林、XGBoost、Light GBM四种机器学习算法分别构建了用户信用风险评估模型,并结合网格搜索法对模型进行了调参优化。结果显示在AUC、F1-score等评价指标下,Light GBM模型的表现效果最佳,其中AUC、F1-score分别为0.836和0.723。为了对用户信用风险评估模型做进一步的优化提升,本文采用了Stacking模型融合方法,第一层以表现效果较好的随机森林、XGBoost、Light GBM这三种模型作为基分类器,第二层采用逻辑回归模型作为元分类器并对第一层的输出进行训练。结果显示在Stacking模型融合方法下,多项评价指标均优于单个模型,其中AUC值达到了0.842。本文通过对银行用户信贷数据进行分析实验,先后构建了四种机器学习模型,并在Stacking方法的基础上搭建了用户信用风险评估模型。最终模型的表现效果较好,对用户信用风险评估具有一定的参考意义。
其他文献
文章综述我国珍稀食用菌产业发展现状:中国食用菌10年来的统计数据表明,我国珍稀食用菌类占食用菌总产量比重为10%~18%,生产集中度较高,区域特点明显,云南的珍稀食用菌类产量最高,达52.19%,其次湖南、内蒙古比例40%,上海、贵州、福建、江西、广东比例30%。重点介绍羊肚菌、大球盖菇、白灵菇、茶树菇和桑黄等5种主要珍稀食用菌生产现状及产业发展存在的主要问题,并对珍稀食用菌产业发展前景进行展望。
目的:本研究旨在通过在内镜下喷洒紫倍煎联合药物注射治疗急性非静脉曲张性上消化道出血(ANVUGIB)患者,并观察内镜下治疗后的止血效果及内镜下治疗的安全性,目的是为了本病的治疗寻求一种止血速度快且安全性高的措施。方法:选取50例诊断为ANVUGIB患者,同时在无锡市中医医院消化科住院,50例患者被随机分为对照组(内镜下注射肾上腺素)和试验组(对照组基础上加喷洒紫倍煎),每组25例,内镜下治疗前均予
B2C是指企业和消费者之间进行的交易行为,B2C还分为自营型B2C和平台型B2C,本文主要研究自营型B2C电子商务的商业模式。自营型B2C是指与商品销售相关的,各环节由运营商实现,其中京东商城最具代表性。京东是一个综合网上购物商城,凭借着高效、稳定、优质的物流体系,成为很多人网购的首选。京东商城的创始人刘强东最开始只售卖光碟、刻录机等商品。那时的京东只是一个小商店,了解的人并不多,随着时间的推移和
报纸
当前随着移动信息平台不断发展,互联网自然语言处理需求也与日俱增。近几年随着微博、微信、QQ等短文本信息平台流行度越来越高,短文本信息量呈指数型增长,短文本信息中蕴含着巨大的数据价值和广阔的市场前景,如何挖掘出这部分价值成为了值得探讨的话题。构建文本实体指称和知识库实体之间的实体链指是短文本语言处理领域的重要一环。本文围绕提升中文短文本实体链指效果,在目前已有的研究基础上,做了如下工作:(一)针对中
目的:NLRP3炎症小体是先天免疫系统的重要组成部分,它通过介导caspase-1激活和促炎细胞因子IL-1β/IL-18的分泌,以响应微生物感染和细胞损伤。干扰素调节因子3(Interferon Regulator 3,IRF3)是抗病毒固有免疫中调节干扰素产生的关键因子,同时IRF3在炎症反应以及抗菌免疫中也发挥重要作用。本课题旨在研究IRF3调控NLRP3炎症小体活性的具体机制,为NLRP3
为确定羊肚菌汤适宜的煮制时间,本文对煮制20、40、60和120 min的羊肚菌汤的感官指标、挥发性风味物质及氨基酸进行量化分析,结果表明:羊肚菌汤在煮制40 min时色泽、气味和滋味最好,评分显著高于其他煮制时间;煮制过程中共检测出49种挥发性风味物质,在煮制20、40、60和120 min的羊肚菌汤分别鉴定出22种、35种、31种、27种,醛类、酸类、酯类和烃类物质的总量在煮制40 min时显
学位
作为各国普遍看好的“低碳燃料”,氢能已经成为欧盟国家替代能源领域的“香饽饽”。2022年3月22日,德国副总理Robert Habeck远赴阿联酋敲定进口协议,预计今年内将首次从阿联酋进口蓝氢。作为各国普遍看好的“低碳燃料”,氢能已经成为欧盟国家替代能源领域的“香饽饽”。
期刊
随着经济社会的发展,信用已经成为日常生活中的重要组成部分,需要科学严谨的方法进行信用评估。在当前大数据时代的背景下,数据具有结构多元化和数据量庞大的特点,传统的主观信用评价方法难以适应快速的市场变化情况,因此各类金融机构需要通过统计学的方法进行建模,实现个人信用评价以降低信用风险。本文在传统支持向量机(SVM)的基础上,提出改良的加权最小二乘支持向量机(WLS-SVM),并与集成算法XGBoost