论文部分内容阅读
医疗保险作为社会保障制度的一部分,在保障全体劳动者健康方面发挥了主要的作用。与此同时,医疗保险的欺诈和违规现象日益增长,导致医疗资源的浪费。因此,从临床诊疗过程中发现临床不合理现象,对预防违规和欺诈行为,完善医疗保险监督体制、为监督工作提供执法依据,以及最大程度地减少医疗保险基金的流失有着十分重要的现实意义。结合课题研究背景及国内外研究现状,本文利用数据挖掘技术挖掘出医疗保险数据中的临床序列相似性关系,并以此为基础,构建临床序列异常检测模型,发现隐含的不合法临床行为。本文的主要工作如下:1、分析了临床序列存在顺序和并列时序关系以及具有持续性、间隔性的特点,提出了基于编辑距离的临床序列相似关系挖掘算法。其中使用打分模型和罚分模型计算序列间的距离,采用Needleman-Wunsch算法得到临床序列间的最小相似度;引入顺序扫描和滑动窗口技术进行子序列匹配。2、在匹配临床事件时,针对临床用药事件是根据其药理效应在临床上的表现影响着临床治疗过程的特点,借鉴SimRank算法思想,通过对药效的关系分析,挖掘用药事件的相似度,并对SimRank算法进行了扩展,设计并实现了药品效-效相似度挖掘算法。3、以临床序列相似关系挖掘算法为基础,抽取出临床序列中的频繁行为和非频繁行为;对频繁行为进行数据转换,构造出临床序列的特征空间,根据特征空间中频繁模式在临床序列中的时序构建Markov模型(频繁行为规则库);对非频繁行为进行归一化,利用聚类算法建立非频繁行为分类器(非频繁模式规则库)。4、根据临床异常现象在频繁行为和非频繁行为中不同的表现形式,以上述构建的规则库为匹配依据,采用Markov模型和聚类的算法思想,设计出频繁行为异常检测模型和非频繁行为异常检测模型。5、最后,通过原型系统设计实现了相关算法,并对甄别出的临床违规和欺诈行为进行了评估与分析,验证了模型的正确和可用性。