论文部分内容阅读
目前国内人寿保险公司的核保策略单一的考虑了投保人的一些健康因素,忽略了人群的健康因素之间的交叉关系。这种核保方法简单易行,但忽略掉的重要信息足以产生影响最终结果的巨大风险。并且由于保险行业在中国多年的积累,已经具备了产生和开发新的智能核保算法的基础。在新的智能核保算法的帮助下,不仅有望较大的提高风险分类的准确性,而且可能降低保费,对人寿保险在中国的发展起到推动作用。本文首先综述了机器学习中统计学习理论的研究现状和国外机器学习在核保领域的应用研究现状,指出目前机器学习在核保领域的研究正处于起步阶段,统计学习理论的应用还有待发展,支撑向量机在核保风险的分类领域还有着巨大的发展前景。接着分析目前国内人寿保险的核保现状,现在国内的核保主要采用点数相加的简单方法,这种核保实务的优缺点非常明显,因为这种方法忽略了各个项目之间内在的联系,只是单纯的考虑不利因素,而忽略了有利因素;若两个客户具有相同的总点数,则核保结果相同,但是个体之间可能有不同的风险。这样的核保过程对于剔除风险较大的客户效果明显,但对于中等风险的客户结果却较为模糊,不利于降低客户总体风险。考虑到各方面因素,需要引入一种核保方法,既可以剔除高风险客户,又可以考虑到中等风险的客户。
本文提出的核保算法首先应用数据挖掘的关联规则算法对保险数据进行处理,主要是对核保数据项之间的关系进行分析,然后补充不完整的客户数据。接着引出了统计学习理论中的支撑向量机,利用支撑向量机良好的范化性能对客户进行分类。利用先验知识将保单申请人划分为三类,分别代表三类不同风险类型的客户,为便于阐述将两类风险较为接近的客户类合并。最后通过试验数据来训练支撑向量机,并通过预测数据进行检验。利用一些保险公司真实数据来进行试验和检验,试验算法用C++实现,采用不同的核函数和不同的σ值来进行计算和测试,试验结果表明在现有的技术条件下采用径向基函数的机器性能最好,当σ=7时有最好的训练和测试准确性。最后给出了改进本算法的设想,主要是在数据的丰富和多样性方面和对核函数研究。
本文所提出的算法优点是承认和充分考虑到各个健康告知项目之间的内在联系,利用关联规则算法对其进行挖掘分析,然后利用支撑向量机辅助决策,减少人为操作的失误和盲目性,如果将这种方法作为现有技术的检验或补充无疑将对风险控制有着巨大的作用。试验表明该算法在人寿保险核保中有较好的应用前景和发展空间。但由于数据量不足及客户数据残缺较多,影响了测试的正确率。随着业务扩展和数据以及经验的累积,加大实验数据量以及对残缺数据采用更有效的补全算法,相信该算法的结果精确度一定会进一步提高,从而可较大的提高本算法的实用性,进而减少投保人群的总体风险,对于降低保费有重要意义。
本文的贡献在于首次应用了关联规则和支撑向量机到了寿险核保领域。随后本文利用真实数据进行实验和检验,提出了运用实验寻找模型参数的方法,通过实验数据可以看到,该算法表现出了较好的泛化性能和适应性能。