基于RF-SMOTE-XGboost下的银行用户个人信用风险评估模型

来源 :现代电子技术 | 被引量 : 0次 | 上传用户:gongpeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代下,用户信用数据中的高维稀疏特征与样本不平衡现象日益显著。为处理高维特征,文中采用随机森林(RF)从Filter和Wrapper角度进行特征提取,并用SMOTE算法对训练集样本做采样处理。模型训练阶段使用粒子群优化算法对XGboost模型做分类精度提高。最后,采用一开源银行数据集提供的数据进行实例验证。结果表明,相较于一般的GBDT模型和网格搜索法,所建立的模型在评估时具有更好的精度与收敛性。
其他文献
在移动机器人的同步定位与建图(SLAM)研究中,使用单一的Kinect传感器或激光传感器时,出现建图精度低、信息不完整、回环检测易出错、可靠性差等问题,为此提出一种方案,将这两种传感器进行融合,利用融合之后的数据来创建环境地图。该方法首先将Kinect采集的深度图转换成伪激光数据后,与激光传感器的数据进行融合,来构建环境的局部栅格地图,并利用融合后的数据进行激光回环检测。当检测到有回环时,再利用K
在风景旅游区、商场、车站、广场等大型公共场所对人流量监测统计有广泛的应用需求,利用人流量监测系统数据的反馈,可以优化资源的分配以获得最大化的社会和经济效益,也可以
传统的英语远程多媒体教学系统,交互能力较差,导致学生对于英语的学习热情不高,因此文中设计基于虚拟现实的英语远程多媒体教学系统。该系统选用3D扫描仪以三维立体检测的方式辅助建模,三维视觉显示设备显示虚拟的教学立体场景,手套和操作杆等交互设备发送学习指令、接收教学信息反馈,实现该教学系统在硬件上的设计。利用小平面模拟实物曲面,参考误差函数调整虚拟教学场景中的模块尺寸,根据像素分辨率计算公式调整模块像素
针对超宽带定位系统受到人员运动影响,定位精度降低的问题,提出一种超宽带人员运动定位的小波阈值去噪方法。通过研究不同的小波基函数、阈值选取规则和阈值函数对人员运动产
兖州矿业(集团)公司杨村煤矿针对压力机多台高压油泵在每个压板周期内有较长时间处于卸荷空转状态的情况,采用变频器对电机进行拖动控制,达到节能降耗的目的。该压力机液压系统
高分辨率遥感影像空间信息丰富,同时也给地物分类带来挑战。故提出一种基于词袋模型的地物分类方法,通过实验讨论词袋模型在这一问题中的适用性。首先在多尺度影像下随机选取场景,通过场景的底层特征聚类建立多尺度视觉词典;然后用视觉单词表达少量标记样本来训练支持向量机;最后用分类器提取典型地物。结果表明,在多尺度词袋模型表达下,研究区分类总体精度达到92.18%,Kappa系数为0.880 9。对比实验结果表
“民以食为天,食以安为先”,食品行业关系到千家万户的生命健康,是我国国民经济的重要支柱产业。然而,近年来食品安全事件时有发生从“三聚氰胺”、“苏丹红”到“瘦肉精”,
针对混合动力汽车纯电动模式向混合驱动模式或发动机单独驱动模式切换时,因双动力源响应差异而引起的转矩波动问题,提出模式切换转矩协调控制策略。仿真结果表明,在阶跃响应
针对当前电商大数据背景下的数据分类与挖掘中存在递归效率低、周期频繁、冗余度高等问题,文中提出一种基于人工智能的大数据分类和挖掘算法。该算法采用快速Spark架构,在将