基于数据挖掘技术的P2P借贷违约预测研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:dx0746
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
P2P网络借贷平台,简称P2P,是互联网金融的一种重要形式。P2P作为一个平台连接了两类群体,一类群体需要筹集资金,另一类群体有闲置资金需要投资机会。2008年金融危机后,人们很难从银行申请小额度的信贷贷款,而小微企业也很难得到传统投资者的青睐。这一现况使得借贷市场产生了巨大的小额度信贷需求,而P2P迅速地填补了这一空白。P2P以其低成本、低门槛的特点迅速发展,成为小额信贷和民间借贷的重要渠道。然而,P2P面临的关键问题之一是缺乏丰富的传统金融客户信息、健全的信用报告体系、有效的信用评估,造成违约风险明显高于传统金融机构。因此,如何通过数据建立有效的贷款违约风险评估模型,对P2P网络借贷平台具有重要意义。违约预测模型的目标是预测借贷人是否会违约,这是P2P公司生存的关键。大多数研究试图通过改进分类方法来提高模型预测的精度,而不考虑数据集中存在缺失值的情况以及数据不平衡的问题。在本次研究中,我们将重点放在如何处理数据集中的缺失值和解决数据不平衡问题,希望通过数据预处理来提升违约预测模型的性能。本文中我们提出了一个新的缺失值填补方法,首先用贝叶斯方法将类别型特征从无序映射成有序,然后计算每个类的类中心、标准差和样本距类中心点的平均距离,利用这些统计值进行后续缺失值填补。对于如何处理数据不均衡,我们采用将聚类、随机灵敏度测度和径向基函数神经网络相结合的混合欠采样方法。本文利用34个UCI机器学习库的数据集(包括15个特征均为连续值的数据集、11个特征均为类别型的数据集和8个变量即有连续型特征又有离散型特征的数据集),以及中国某P2P网贷平台的真实贷款违约数据,验证了我们使用的方法的有效性。
其他文献
在经济新常态时期,经济增速日益减缓,但是国内竞争环境却日趋激烈,这无疑加剧了企业的生存压力,尤其是伴随着全业务经营的全面铺开,电信运营企业更是面临着严峻的挑战,这迫使其必须要以实现企业价值最大化为核心追求,采取行之有效的战略举措,抢占市场份额,以此全面提升企业业绩。而要想满足这一目标,企业就必须要重视业绩评价工作。然而,在新的时代背景下,原有电信企业业绩评价指标表现出明显的不适用性,无法准确、科学
泥石流作为一种地质灾害对人类和自然带来的危害越来越不容忽视。泥石流的防治措施之一是修建泥石流的防治堤坝,所以在实际应用中堤坝的设计参数起到了至关重要的作用。这些防治堤坝的修筑高度和形状均与泥石流冲击过程中泥浆对斜坡产生的压力有关,而这个压力取决于泥浆最高点与斜坡产生的相对高度。采集泥石流运动过程中的高度数据需要一个多点同步数据采集系统。本文主要研究的是基于FPGA泥石流运动模型中的多点同步信息采集
新疆中亚食品研发中心(有限公司)(以下称为中亚食品研发中心)作为中亚地区果蔬深加工的代表性企业,也是我国实施走出去战略的代表企业。随着以哈萨克斯坦为主的中亚国家果蔬
表面界面生长的随机过程会表现出非平庸的标度特性,此外,表面界面还具有可以转化成符合生长动力学中的标度不变性的平稳状态的特征。我们正是用这两个特性对材料表面的生长过程进行正常的标度研究。在符合生长表面的标度不变性的基础上,我们再研究材料表面的生长过程就有了最基础的理论与标准,并且可以被广泛地使用到研究生长过程的理论模型与实验研究上。研究表面生长动力学标度行为的最重要的框架就由自仿射分形、标度和普适类
近年来工程机械企业加快全球产业布局,推动企业国际化进程。三一重工、徐工机械、中联重科等为代表的国内工程机械企业在国际市场的竞争力进一步提升,但与卡特彼勒、小松制作所等全球行业龙头品牌仍有较大差距。本文选取三一重工、徐工机械和中联重科这三家国内工程机械行业的龙头企业作为评价对象,在苏勇等人的品牌国际化蛛网模型体系的研究基础上,选取了品牌认可度、国际化经营方式、组织结构、海外销售额占比、品牌国际化实施
自2014年中国证监会颁布《优先股试点管理办法》以来,我国的优先股试点工作也已经开展了6年了。然而,起源于西方的优先股,在域外已经有着丰富的实践经验,相较而言,优先股制度在我国只能算是蹒跚起步的婴儿,我国在优先股的发行、上市、退出、保护等政策制定方面还不太完善。虽然学界对优先股有无表决权一直存在争议,但是有无表决权并非优先股的本质特征,无表决权股也不能与优先股划等号。从我国的实践经验来看,无表决权
在中国制造2025与纺织工业“十三五”规划的背景下,通过利用传感器技术,嵌入式技术及网络技术对企业纺织生产设备进行改造势在必行。机械包覆纱机是通过旋转机构制作包覆纱的生产设备,其在纺织行业的中扮演着重要角色,但其维护是困扰企业的一个难题。本文分析了机械包覆纱机的生产工艺要求与工作原理,从设备状态未知、维护繁琐的问题出发,结合国内外设备监控技术的发展情况,对监控对象进行选择与分析,在相关技术路线的研
十九大报告指出,要加强生态文明建设,推进绿色发展,着力解决环境问题,改革生态环境监管体制,其中强调“加强固体废弃物和垃圾处置”。医疗废物污染防治是城市公共卫生管理和生态环境建设的重要组成部分。我国2003年出台《医疗废物管理条例》,随后颁行了一系列配套法规,在医疗废物管理中取得一定成效,但仍然存在倒卖和非法处置医疗废物的现象,究其根本,监管不力是主要原因。解决这一问题需要在现有制度基础上完善医疗废
随着我国电信市场的不断改革,以及互联网、大数据等信息技术的快速发展,电信企业的业务也逐渐多元化,随着新兴业务的快速发展,原有的成本管理方法难以有效的进行成本控制,也难以为企业的战略投资、产品定价等投资经营相关活动提供有效的决策。因此,在目前形势下,建立完善有效的成本管理体系是电信企业持续发展的关键。本文首先采用文献研究法梳理了成本管理的相关文献,做出文献综述;之后采用案例研究法,以Y电信公司为例,
MIL-STD-1553B数据总线已经广泛应用于航空航天综合电子系统中,目前国产协议芯片重量体积较大、协议处理方式相对固定,仍需要CPU软件的紧耦合操作。随着航天技术的发展,航天任务对重量、体积和功耗均提出了较为苛刻的要求。因此设计一种具有自治能力、能够灵活调度总线消息且可自由安排消息帧的总线控制器IP核尤为重要。本文正是在深入研究1553B总线协议规范的基础上,围绕OPCODE控制逻辑对core