基于SVM的寿险核保方法

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:HOHO333
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前国内人寿保险公司的核保策略单一的考虑了投保人的一些健康因素,忽略了人群的健康因素之间的交叉关系。这种核保方法简单易行,但忽略掉的重要信息足以产生影响最终结果的巨大风险。并且由于保险行业在中国多年的积累,已经具备了产生和开发新的智能核保算法的基础。在新的智能核保算法的帮助下,不仅有望较大的提高风险分类的准确性,而且可能降低保费,对人寿保险在中国的发展起到推动作用。本文首先综述了机器学习中统计学习理论的研究现状和国外机器学习在核保领域的应用研究现状,指出目前机器学习在核保领域的研究正处于起步阶段,统计学习理论的应用还有待发展,支撑向量机在核保风险的分类领域还有着巨大的发展前景。接着分析目前国内人寿保险的核保现状,现在国内的核保主要采用点数相加的简单方法,这种核保实务的优缺点非常明显,因为这种方法忽略了各个项目之间内在的联系,只是单纯的考虑不利因素,而忽略了有利因素;若两个客户具有相同的总点数,则核保结果相同,但是个体之间可能有不同的风险。这样的核保过程对于剔除风险较大的客户效果明显,但对于中等风险的客户结果却较为模糊,不利于降低客户总体风险。考虑到各方面因素,需要引入一种核保方法,既可以剔除高风险客户,又可以考虑到中等风险的客户。 本文提出的核保算法首先应用数据挖掘的关联规则算法对保险数据进行处理,主要是对核保数据项之间的关系进行分析,然后补充不完整的客户数据。接着引出了统计学习理论中的支撑向量机,利用支撑向量机良好的范化性能对客户进行分类。利用先验知识将保单申请人划分为三类,分别代表三类不同风险类型的客户,为便于阐述将两类风险较为接近的客户类合并。最后通过试验数据来训练支撑向量机,并通过预测数据进行检验。利用一些保险公司真实数据来进行试验和检验,试验算法用C++实现,采用不同的核函数和不同的σ值来进行计算和测试,试验结果表明在现有的技术条件下采用径向基函数的机器性能最好,当σ=7时有最好的训练和测试准确性。最后给出了改进本算法的设想,主要是在数据的丰富和多样性方面和对核函数研究。 本文所提出的算法优点是承认和充分考虑到各个健康告知项目之间的内在联系,利用关联规则算法对其进行挖掘分析,然后利用支撑向量机辅助决策,减少人为操作的失误和盲目性,如果将这种方法作为现有技术的检验或补充无疑将对风险控制有着巨大的作用。试验表明该算法在人寿保险核保中有较好的应用前景和发展空间。但由于数据量不足及客户数据残缺较多,影响了测试的正确率。随着业务扩展和数据以及经验的累积,加大实验数据量以及对残缺数据采用更有效的补全算法,相信该算法的结果精确度一定会进一步提高,从而可较大的提高本算法的实用性,进而减少投保人群的总体风险,对于降低保费有重要意义。 本文的贡献在于首次应用了关联规则和支撑向量机到了寿险核保领域。随后本文利用真实数据进行实验和检验,提出了运用实验寻找模型参数的方法,通过实验数据可以看到,该算法表现出了较好的泛化性能和适应性能。
其他文献
利用二维Lotka-Volterra系统存在正平衡点时奇点的分类条件,再借助于二维Lotka-Volterra系统与三维复制系统的同胚变换,在不考虑时间可逆的条件下,得到三维复制系统存在正平衡点时,其动力学行为的完全代数分类条件及相图.利用这些分类条件,我们验证了一些已知的结果,并且得到一些新的结果.
学位
随着世界经济的快速发展和全球对资源消耗问题的日益重视,对制造行业中的资源优化利用问题的研究显得越来越重要。在制造过程中的优化下料问题便是具有广泛应用的资源优化利用
房地产行业是风险性行业,存在许多不确定性,如何对此类投资项目进行正确评估,是每个开发商所普遍关心的问题。以往,房地产项目评估采用的是传统的决策方法,但其回避不确定因素的特
数据挖掘与知识发现(Data Mining and Knowledge Discovery简称为KDD)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是