机器学习方法及其可解释性技术在车险定价中的应用 ——基于XGBoost模型

来源 :东北财经大学 | 被引量 : 0次 | 上传用户:du_go666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前机器学习方法在诸多领域得到了广泛的应用,并取得巨大进展,但由于存在不可解释、不透明的缺点,制约了其在非寿险精算领域的实际应用。与此同时,我国商业车险市场化改革放大了保险公司的自主定价权,从而对其定价能力提出了更高的要求。因此可解释的人工智能技术在机器学习精算模型中的应用研究,将有助于机器学习方法在非寿险精算领域的推广,为保险公司提供了一种新的定价思路。本文主要是通过可解释的人工智能技术,研究机器学习精算模型的车险费率厘定过程,并以传统的广义线性模型为基准,说明机器学习精算模型的车险费率厘定过程及其预测结果具有合理性。首先,基于法国第三方责任险的车险保单数据freMTPL2freq和freMTPL2sev,对被保险人在一个保险年度的车险累积索赔额进行建模,并通过均方根误差来评价损失预测模型的预测精确度。然后,使用置换特征重要性方法、importance方法、interaction方法等可解释的人工智能技术,对损失预测模型中的“黑盒子”过程进行可视化、透明化,阐述损失预测模型的具体工作原理。最后,将XGBoost模型与广义线性模型进行对比,说明XGBoost模型的预测过程是合理的。基于车险费率厘定的国内外研究现状,本文提出以下两个创新点:第一,运用机器学习方法中的XGBoost模型,直接对车险累积索赔额进行预测。近年来,机器学习方法逐渐被应用于非寿险精算领域,其中的XGBoost模型更是在各大赛事中崭露头角,目前XGBoost模型主要应用于车险索赔频率及索赔强度的预测问题中,而较少有学者将其用于车险累积索赔额的预测中。因此本文在不考虑索赔是否发生的情况下,运用XGBoost模型中的线性回归对车险累积索赔额进行预测,并将其预测结果与广义线性模型进行比较。第二,运用importance、interaction、waterfall等可解释性方法,综合分析XGBoost模型在车险定价中的“黑盒子”过程。本文在对损失预测模型的可视化过程研究中,使用了 XGBoost模型特有的可解释性方法,与一般的可解释人工智能技术相比,importance方法、interaction方法以及waterfall方法,不仅涉及了车险费率厘定因子的重要性和边际效应分析,还详细且直观的阐述了车险费率厘定因子间交互效应的重要性。损失预测模型的实证结果表明:(1)当以均方根误差作为模型性能的评价指标时,XGBoost模型的预测精确度高于广义线性模型;(2)在可视化损失预测模型的“黑盒子”过程中,以广义线性模型为基准,车险费率厘定因子的重要性分析及边际效应分析结果表明,XGBoost模型的车险费率厘定过程及其结果具有合理性;(3)通过置换特征重要性方法对车险费率厘定因子的重要性分析,可以得出结论,XGBoost模型与广义线性模型中的车险费率厘定因子重要性排序基本一致,其中最重要的车险费率厘定因子是驾驶员风险因子,其次是车辆风险因子,最后是环境风险因子。
其他文献
因教法与学法的不当,一些学生将所学的定义、法则、公式、定理、思想方法等内容变成了惰性知识,极大地影响了数学解题能力的提高。于此,教师需用大概念思维指导学生阅读,进行关联导学、变式教学和单元教学以培养学生的专家思维,并基于专家思维激活学生数学惰性知识。
目的:探讨独活寄生汤对胶原诱导性关节炎(CIA)模型大鼠的抗炎作用及其对TLR2/p38 MAPK/NF-κB信号通路的影响。方法:将48只雄性SD大鼠,随机分为以下6组(n=8),正常组(Control)、模型组(Model)、阳性药甲氨蝶呤组(MTX)、独活寄生汤低(DHJSD-L)、独活寄生汤中(DHJSD-M)、独活寄生汤高剂量组(DHJSD-H)。采用胶原抗体诱导法于大鼠尾根部注射牛Ⅱ型
针对现有地面分割方法在复杂场景存在鲁棒性差和现有传统方法依赖阈值的问题,提出了一种合并式地面分割算法。首先根据车辆行驶实际情况进行预处理;然后对基于射线特征和基于平面模型拟合的方法进行改进与分阶段式融合,第一阶段中加入最大阈值的思想实现粗分割,第二阶段中加入结合道路分布特征和激光雷达线束分布特征的多区域划分思想实现细分割;最后对非地面点进行杂点过滤。实验结果表明,所提方法在复杂场景进行地面点分割的
目的:探究木犀草素对大鼠股骨骨折愈合的影响以及对Wnt/β-连环蛋白(β-catenin)信号通路的调控作用。方法:SD大鼠随机分为正常对照组、模型组、木犀草素低剂量组(50 mg/kg)、木犀草素高剂量组(100 mg/kg)、木犀草素高剂量+Wnt通路抑制剂(IWR-1)组(100 mg/kg+5 mg),每组18只。除正常对照组外,其余4组建立大鼠左股骨骨折模型。造模成功24 h后各组进行相
互联网给"云课堂"的开展提供了坚实的基础,通过各种线上教学软件,师生实现了面对面的云教学。随着"云课堂"的不断发展和在教学中的逐渐深入,如何运用"云课堂"线上线下混合式教学模式实现更好的教学成果成为了重要的研究课题。因此,本文探讨了在信息技术背景下进行线上线下混合式教学,保证教学质量。
由于平台经济中存在信息不完全与信息不对称、交易成本过高以及信任关系缺失等三类主要问题,加上平台经济作为新业态的内在特性的影响,平台企业的运行过程中存在大量的制度空隙。本文系统分析了制度空隙与平台企业之间的互动关系,指出平台企业在弥补制度空隙以谋取私人利益的过程中,促进了市场中的制度建设与完善,也推动形成了市场运行中新的制度空隙,并引发了平台企业的新一轮逐利行为。在这一过程中,平台企业与政府存在制度
近年来社会出现的司法纠纷逐渐增多,导致司法案件数量快速增加,使人民法院的工作任务量逐渐增大。法官对案件的判决是将犯罪事实与法条进行匹配,找到判案的法律依据,从而决定犯罪嫌疑人的罪名并判刑,即以事实为依据,以法律为准绳。这个任务十分耗时而且需要大量专业知识。因此可通过自然语言处理技术,以案情事实描述为输入,预测出对应的罪名。这样可以在法官判案时给予一定的参考,节约人力成本,提高判决预测效率。一些算法
随着科技的不断进步,线上教学已经在很多学校有了广泛的应用。相比于线下教学,线上教学具有开展方式灵活、信息呈现便捷等特点,能让学生对课内外知识进行广泛的涉猎与深入的探究。同时,线下教学一方面具有良好的秩序性,另一方面教师更方便与学生进行良好互动,及时解决学生存在的问题。因此,在小学数学教学中,教师要深入挖掘线上教学与线下教学的特点和优势,采取线上与线下相结合的混合式教学模式,全面提升学生的学习效果。
1882年正式出版的《“女水神”长笛奏鸣曲》是德国著名音乐家卡尔·赖内克最出众的一部室内乐作品,取材自德国浪漫主义作家弗里德里希·富凯的小说《温蒂娜》(Undine)。文章以乐曲的第一乐章为例,在对作品进行曲式结构分析的基础上,通过对乐曲情感表达、演奏技术等方面进行深入剖析,去理解作曲家音乐创作的意义。笔者在文章中更多的融入了自己对于曲目的理解,希望能够帮助演奏者在演奏过程中更好的诠释乐曲。