论文部分内容阅读
广义线性模型(GLMs)从根本上说,属于一种分类费率厘定模型。它是非寿险定价的重要方法,目前更作为个人车险、其他个险险种以及部分商业险种定价的标准方法。 分类费率厘定模型建立在损失数据采集和风险分类基础之上,这就决定了保险人经营过程中,保单信息的缺失、风险识别和分类的有效性,都将直接影响模型的准确性。另外,分类费率厘定模型很难直接评估各种风险因素对风险分类有效性的影响程度,并预测它们对未来损失产生的影响。本文在实证分析基础上,说明了分类费率厘定模型的这些缺陷不可避免的也存在于GLMs定价中。 数据挖掘(DM)是一个从已知数据集合中发现各种模型、概要和导出值的过程。通过这一技术,人们在计算机帮助下利用一系列工具对数据进行分析,然后根据反馈的内容从新的视角来考察原始数据的信息。数据挖掘过程一般包括数据取样、数据研究、数据调整、模型构建和模型评估五个步骤。本文在SAS?环境下,探讨了数据挖掘的各步骤,并阐释了它们在精算学及非寿险定价中的意义。 最后,文章运用SAS? Enterprise MinerTM,利用数据挖掘技术进行了一系列实证分析。本文重新构建了基于回归算法、决策树算法和神经网络算法的六个费率厘定模型,就各模型的改进方法给予了必要说明。最后文章从识别度、区分度、准确度、稳定性和可解释性五个方面分析比较了几个模型,并阐释了各模型存在优劣的内在原因。 数据挖掘技术可以极大的改进传统的非寿险费率厘定方法,帮助精算师自动实现一些重要的费率厘定过程,调整费率结构并建立一个较为合理的个体风险费率厘定系统;同时,帮助保险人识别高风险保险客户,实现降低损失率的目标。