论文部分内容阅读
P2P网络借贷凭借其相对较低的投资门槛,借款的易得性和更低的交易成本的特征,在近几年得到了迅速的发展,开创了平民化投资的新时代。在高速发展的同时也暴露了许多问题,首要的是因信息不对称引发的道德风险和逆向选择,让平台经营者更容易跑路,让借款人不得不提高利率,也让投资者的投资行为呈现非理性的态势;然后,在投资者对高利率的追逐和狂热的风险偏好行为面前,其借贷行为表现的异常的非理性,对于借款人发出的市场信号,并没有做到准确的识别。 在介绍了研究背景和实际意义的基础上,本文系统梳理了P2P网贷研究方面的系列文献,从理论上对投资者的行为进行了探讨,部分揭露了其非理性行为的成因和后果。为了证实非理性的假设,本文从分三步展开研究,第一步,本文从人人贷的交易数据着手,通过数据挖掘的方法,根据已有的信息变量构建模型,分别对借款的成功率和借款的违约率进行预测,分别比较支持向量机、决策树和随机森林模型的预测精度,并得到分类预测的重要变量,在这一步发现随机森林模型的预测效果最好。在借款成功率模型中,其样本内错分率和样本外错分率分别为2.18%和2.161%,在借款违约率模型中,其样本内错分率和样本外错分率分别为3.57%和5%; 第二步,在随机森林模型下,并分别对成功率和违约率模型影响因素的重要性进行排序,发现在现有的硬信息下对借款人的可以有一个良好的鉴别,但也发现一些影响违约的重要因素并没有得到投资者考虑,比如在两个模型中工作时间、借款期限、借款利率和借款金额是共有的重要影响因素,这代表了投资者理性的部分,但影响违约率的重要因素:工作证明和收入证明却没有在借款成功率中得到考虑,这表明投资者在信息不对称下存在一定的盲目性; 第三步,由于在本文中数据变量较多,加上哑变量高达36个,为了模型的精确性和可解释性,涉及到变量选择。在处理P2P数据涉及的高维数据时,运用了lasso变量选择的方法,通过结构化分析,进一步证实了投资者在决策时,限于他们的时间和精力,并没有充分考虑风险和收益因素,投资的盲目性一直存在。