论文部分内容阅读
论文从个人信用评估的特点,以及支持向量机在个人信用评估的应用中存在的若干问题的研究出发,在理论上,提出了基于不同损失的支持向量分类机优化模型,并应用最优化理论,对该模型进行了系统地研究,为本文提出的基于支持向量机的个人信用评估模型奠定了理论基础;在个人信用评估方面,首次建立了基于支持向量机的个人信用评估体系,并对个人信用评估问题进行了全面而深入地研究,给个人信用评估增添了一种新方法,拓广了支持向量机的应用领域;同时,为达到理论和实践相结合的目的,还结合实际数据进行个人信用评估的实证分析,取得了很好的效果。论文的主要工作如下: 1.针对标准的支持向量分类机(C-SVC)在处理两类不同损失的样本点数据中存在的缺陷,提出了基于不同损失的支持向量分类机的优化模型,并第一次对这一最优化模型进行了深入细致地研究,包括原始问题和对偶问题解的性质,及其解的关系等。 2.给出在所有可能的情况下,基于不同损失的支持向量分类机中决策函数闽值的求解公式。 3.根据两类样本点错分后的损失是否已知,给出了两种基于不同损失的支持向量分类机的模型参数的选取方法,为支持向量分类机模型参数选取提供了新的思路。 4.给出了基于保序回归的基于不同损失的支持向量分类机概率输出模型,使其不仅能输出样本点的类别,还能输出样本点属于某一类的概率。 5.个人信用评估前的数据准备问题研究。将信息增益和ROC曲线应用到个人信用指标选择中,首次提出了基于信息增益和AUC的个人信用指标选择方法;综合数据缺失值的单一填补和多重填补方法,提出一种新的信用指标缺失值填补方法—KNNMI。由于论文采用的都是实际数据,这些方法对今后我国商业银行的个人信用指标选择和指标缺失值的填补具有重要的参考价值。 6.第一层次—“违约与否”的判定。根据个人信用样本的不同特点,建立了不同的个人信用评估模型:①在假设两类个人信用样本点错分后给银行带来相同损失的前提下,建立了C-SVC的个人信用评估模型;②根据两类信用样本点重叠较严重的现象,给出了一种提高分类精度的方法—NN-C-SVC-KNN:③鉴于当两类信用样本点错分后,会给银行带来不同的损失的实际情况,首次建立了基于不同损失的支持向量分类个人信用评估模型,使个人信用评估的结果更符合实际。 7.第二层次—“违约概率”的计算。在判断借款人“违约与否”的基础上,进一步判断他以多大的概率违约,论文首次建立了基于不同损失的支持向量分类个人违约概率计算模型,对借款人的“违约概率”进行估计,将个人信用评估更深入了一步。 8.第三层次—“个人信用风险度”的预测。在判断借款人“违约与否”和“违约概率”的基础上,根据信用风险度的实质(贷款形成呆帐的可能性),提出了“个人信用风险度”的概念,首次建立了基于支持向量回归的个人信用风险预测模型,对借款人的贷款资金安全系数(或贷款形成呆账的可能性)进行预测,更加全面地研究了个人信用评估。 以上的研究成果,不仅在丰富支持向量机的内容方面具有一定的理论意义,而且在推动我国的个人信用体系建设,提高我国金融机构消费信贷市场的信用风险管理水平,降低我国金融机构的不良贷款率,促进我国消费信贷市场的进一步发展方面具有一定的现实意义。