医疗保险大数据中的欺诈检测关键问题研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:mulu911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
医疗保险违规和欺诈主要是指为达到经济目的,违反医疗保险管理法规和政策,采取虚构就医行为以及其他方法直接或间接骗取医疗保险基金的行为。这些违规欺诈行为严重干扰了医疗保险制度的正常运行,危害医疗保险基金的安全,损害了参保人的利益。随着医疗保险信息化工作的大幅推进,各级医保机构积累了包括医疗诊断信息、诊疗明细、处方明细以及医疗服务过程中产生的数字化医疗档案的医疗保险大数据,其中隐藏了医疗服务知识和规律,也隐藏了非常少量的欺诈记录。医保欺诈检测需要在医疗保险大数据中抽茧剥丝,从绝大部分正常合理的医疗数据中区分出极少量的欺诈记录,由于医疗保险大数据具有数据量大、数据产生速度快、数据维度高、数据分布不均、违规行为相对隐蔽等特点,使得医保欺诈检测成为一项具有挑战性的工作,主要原因在于:1.治疗流程规律隐藏在病人的医疗诊断信息、诊疗明细、处方明细之中,但由于表示就医活动的治疗/用药项目数量大,频繁模式挖掘过程中易于出现高维诅咒现象,能够被发现的频繁模式数量急剧下降,治疗流程规律不能被有效识别。2.门诊慢性病患者常常组织在一起进行医保欺诈,欺诈者之间行为高度相似,而大多数正常患者虽然彼此之间有不同的行为,但因为病症的相似也可能会偶然存在相同或相似的就医行为,因此不是所有聚类在一起的异常群组都是可疑的,这导致传统的协同欺诈检测方法误报率很高。3.隐蔽较深的医疗违规行为通常会有医疗专业人员的参与,他们会尝试一切方法以避免违反检测规则,传统的聚类或离群点检测方法难以察觉这些行为。而医疗专业人员(如医生)的数量相对病人的治疗数据较少,在医保系统中记录的各种信息不全面,仅仅基于医保数据难以根据统计学特征对医生进行有效的聚类。本文致力于医疗保险大数据中的欺诈检测研究,旨在识别医疗服务消费和医疗流程中存在较大偏离的就医行为,缩小疑似欺诈医生/病人集合,以利于精准定位疑似欺诈行为。本文从异常医疗流程检测、患者协同欺诈检测和医生欺诈检测等方面进行探讨与研究等多个具有挑战性的实际问题进行了系统和深入地研究,主要工作与贡献概括如下:1.提出一种基于粗粒度行为模式发现的异常医疗流程发现方法,对数量繁多的就医活动进行聚类,在粗粒度活动类序列中进行频繁模式挖掘获得医疗流程规律,进而检测得到与规律相违背的异常医疗流程,避免高维诅咒,提高规律挖掘效率。将粒度细数量多的就医活动转换成加权行为图,通过半监督的流形学习SSIsomap方法将行为图映射到欧式空间,利用有关行为数据类别的知识,将就医活动聚类获得粗粒度活动类。然后对重新编码后的粗粒度行为序列利用频繁模式挖掘的方法找到行为模式即医疗流程规律,提高规律挖掘效率。最后对于待判别的记录,根据其与行为模式的相似度大小得到其存在欺诈行为的概率。该方法可以有效避免高维诅咒,在大型医保数据集上的实验证明了方法的有效性和高效性。2.提出了一种基于异常群组的患者协同欺诈检测方法,利用人与人之间的相似性邻接图将可疑欺诈者与具有异常行为的正常人区分开来,降低因非欺诈异常行为引起的欺诈误报,保证检测结果的高准确率。专注于检测进行协同欺诈的极少数患者,提出一种基于异常群组的协同欺诈检测方法。本方法先根据人物行为相似度计算人与人之间的相似度,构建人物行为相似度邻接图G。计算G中的极大集枚举并获得异常群组。选择能够区分可疑组和正常组的特征,将已取出的异常群组分类为正常组和可疑组,将可疑组中的人员导出进行人工检查。本方法可以克服将可疑的协同欺诈者与因周期性而碰巧具有高度相似性的人区分开来的挑战,因此可以确保高准确率。此外还通过提出基于两步H图的MCE来减少计算。医疗保险数据集的大量实验表明,此方法在准确率方面优于现有方法20%以上。3.提出一种基于异构网络社区离群点检测的医生欺诈发现方法,利用医保领域中各实体对象间的关系,通过社区划分获得相似医生簇,分析簇中的医生行为特征取值序列的细微变化,构建多组相关概率模型用以检测簇内离群点,以发现有欺诈行为的医生。将医生、病人处方、药品等各实体对象及相互关系构造医生-药品异构信息网络,提出基于标签传播的带约束重叠社区划分算法,开方行为相似的医生分在同一社区中。分析同一社区中医生行为特征的相关性和变化范围,构建多组相关概率模型,通过特征取值序列的细微变化来检测隐蔽较深的医疗违规行为和有欺诈行为的医生。该方法利用在社区划分的结果中发现离群记录,将复杂问题分而治之,降低了算法复杂程度,提高了时间效率和离群记录识别效率。
其他文献
高新技术产业园区自产生以来,便在新技术革命中占有重要的地位。集群是高技术产业重要的区位特征,国际化的高新技术产业园区是高技术产业的集聚空间。因此,按照产业集群的规
青少年沉溺网络,不仅在中国成为令学校教师和父母忧心忡忡的问题,在欧美国家同样令成年人感到一筹莫展。$$不过,沉溺网络是否就构成所谓的“网瘾”,在精神医学界一直都充满争议。
报纸
朱尔·巴比埃(Paul Jules Barbier,1825—1901)是法国最富有创造力的作家之一,他是诗人、作家,又是歌剧脚本作者。他创作了多部歌剧脚本,除德国作曲家贾科莫·梅耶贝尔的(《
研究了工艺系统力变形对加工误差的影响,论述了影响工艺系统力变形的因素和规律,采用VB6.0进行软件程序设计,实现了计算机辅助工艺系统受力变形分析。该程序适用于任意加工条
从对思维导图的设计与制作、思维导图与概念图的区别、思维导图用于乳腺癌的护理等方面进行综述。发现虽然研究理论体系形成、研究内容也较为完善,但还存在大部分研究未绘制