盲目的借贷——基于数据挖掘方法的P2P网络借贷的研究

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:sql70
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
P2P网络借贷凭借其相对较低的投资门槛,借款的易得性和更低的交易成本的特征,在近几年得到了迅速的发展,开创了平民化投资的新时代。在高速发展的同时也暴露了许多问题,首要的是因信息不对称引发的道德风险和逆向选择,让平台经营者更容易跑路,让借款人不得不提高利率,也让投资者的投资行为呈现非理性的态势;然后,在投资者对高利率的追逐和狂热的风险偏好行为面前,其借贷行为表现的异常的非理性,对于借款人发出的市场信号,并没有做到准确的识别。  在介绍了研究背景和实际意义的基础上,本文系统梳理了P2P网贷研究方面的系列文献,从理论上对投资者的行为进行了探讨,部分揭露了其非理性行为的成因和后果。为了证实非理性的假设,本文从分三步展开研究,第一步,本文从人人贷的交易数据着手,通过数据挖掘的方法,根据已有的信息变量构建模型,分别对借款的成功率和借款的违约率进行预测,分别比较支持向量机、决策树和随机森林模型的预测精度,并得到分类预测的重要变量,在这一步发现随机森林模型的预测效果最好。在借款成功率模型中,其样本内错分率和样本外错分率分别为2.18%和2.161%,在借款违约率模型中,其样本内错分率和样本外错分率分别为3.57%和5%;  第二步,在随机森林模型下,并分别对成功率和违约率模型影响因素的重要性进行排序,发现在现有的硬信息下对借款人的可以有一个良好的鉴别,但也发现一些影响违约的重要因素并没有得到投资者考虑,比如在两个模型中工作时间、借款期限、借款利率和借款金额是共有的重要影响因素,这代表了投资者理性的部分,但影响违约率的重要因素:工作证明和收入证明却没有在借款成功率中得到考虑,这表明投资者在信息不对称下存在一定的盲目性;  第三步,由于在本文中数据变量较多,加上哑变量高达36个,为了模型的精确性和可解释性,涉及到变量选择。在处理P2P数据涉及的高维数据时,运用了lasso变量选择的方法,通过结构化分析,进一步证实了投资者在决策时,限于他们的时间和精力,并没有充分考虑风险和收益因素,投资的盲目性一直存在。
其他文献
在我们这个年龄,正值花季。如同初升的太阳,散发着金色的光辉;如同含露的花儿,娇艳欲滴。  在这个年龄,我们是多梦的。刚褪去童年的幼稚与懵懂,与小伙伴们无拘无束玩耍的场景,似乎还在眼前。是呀,我们多么不愿长大,依然想当那个童言无忌、欢乐开怀的自己,那个时常可以去彼得·潘的梦幻世界里尽情游玩的自己,那个天真烂漫的自己。  在这个年龄,我们也有烦恼。随着年龄的增长,在漫漫的成长路上,我們要面对更多的挫折
期刊