论文部分内容阅读
随着互联网消费和线上支付时代的到来,我国商业银行的个人网贷业务呈现井喷式发展态势,银行对客户信用的评估方法,由原来的以央行征信为核心,纷纷转变为基于互联网行为信息构建大数据风控及信审平台,风控决策环节的模式化、自动化、批量化水平不断提高。这种互联网大数据风控技术的普遍使用,一方面提高了金融机构的信贷批量审批效率,另一方面却又在数据质量、模型健壮性等方面存在弱点,容易被不法分子通过技术手段攻击而造成信贷损失。本文认为电信运营商积累的电信大数据,可以有效弥补互联网大数据在风控领域的不足,通过提出一整套实用算法,有效提取了蕴含在电信大数据中的客户行为特征,将其与互联网大数据融合到一起,构建风控模型和系统,取得了良好的征信评估效果。 本文首先回顾了国内外征信评估体系的建立和发展脉络,结合大数据征信技术的特点和需要,分析了电信运营大数据在征信评估中的独特优势,指出了其在贷前、贷中、贷后等信贷环节中的应用价值和使用方法。在具体的数据分析算法方面,目前国内外的大数据风控研究大都基于纯数学和统计学原理来构建算法和模型,本文则试图汲取学科交叉研究的思想,从信号学角度重新审视大数据,探索将经典的平面信号处理理论和技术用于电信大数据的分析,最终将高斯滤波、k-means聚类和直方图统计等平面信号处理算法有机结合,提取并结构化描述了电信数据中蕴含的具有高度不变性的用户行为特征。将电信行为特征作为权重数据项,参加风控评分卡的建立,取得了预期的风险识别和客户区分效果。最后,本文基于“MPP+Hadoop”的混合架构设计,将算法和评分卡模型成功落地为银行互联网信贷审批系统,证明本文提出的算法流程和模型具有良好的工程实用前景。 结论:本文通过相对成熟高效的算法,提取了电信运营数据中的用户行为特征,以其参加大数据信贷风控模型的构造,成功提高了信用评分模型的整体可靠性,在基于K-S值统计的量化评测中,引入电信大数据后的风控模型在样本区分度和评分准确度方面均有优异的改善效果和表现。