论文部分内容阅读
网络借贷P2P平台自2005年从欧美国家兴起,近十年来在国内的发展经历了从高速增长到基本饱和的阶段,投资者们开始寻求新的市场。东南亚地区拥有22亿人口,自2014年来互联网行业实现了跳跃式发展,互联网金融行业站在高速发展期的风口。与个人征信覆盖率高达90%的欧美国家相比,大部分东南亚国家银行帐户渗透率只有不到40%,未被征信覆盖到只能寻求网络信贷平台的帮助的人群数量庞大,网络借贷平台巨大的市场需求显现。面对申请人不全面的数据和空白的信用记录,如何搭建高效的风控模型是风险评估人员亟待解决的问题。东南亚地区的贷前风险评估方式有人工审核和机器审核两种方式。人工审核一般耗时三天以上,风险识别能力不强,效率和准确率都较低。机器审核一般采取信用评分的方式,根据借款人的历史信息预测其违约概率,再将违约概率转化为信用评分,最后根据借款人的信用分数进行决策。本文对传统评分卡和机器学习方法在东南亚借贷市场的信用风险预测性能进行了实证研究。本文基于东南亚44035条实际客户贷款表现数据,首先经过缺失值处理、变量衍生和变量筛选等一系列数据处理步骤后,再分别采用逻辑回归、决策树、随机森林、GBDT、XGBoost五种算法进行实证分析,对申请客户进行违约概率预测并于实际结果进行对比,结果显示机器学习算法GBDT性能最好。最后,对传统逻辑回归和机器学习算法GBDT,分别给出了评分转换方法和评分结果。从本文实证结果来看,在东南亚市场,机器学习算法比传统评分卡模型能达到更高的预测精度,同时也能和传统逻辑回归评分模型一样转化为信用评分,能够构建更加有效的风控体系,为信贷审批工作者提供更加有效的参考标准。