【摘 要】
:
离群点挖掘是数据挖掘中的重要分支之一。近年来,离群点挖掘得到许多学者的广泛关注和研究。在平日生活中,存在着少数与众不同的信息,这些信息容易被人忽略,但它们往往具有更
论文部分内容阅读
离群点挖掘是数据挖掘中的重要分支之一。近年来,离群点挖掘得到许多学者的广泛关注和研究。在平日生活中,存在着少数与众不同的信息,这些信息容易被人忽略,但它们往往具有更大的价值。离群点挖掘是一种可以帮助人们在纷繁复杂的信息中准确快速地获取具有显著异常特征信息的数据挖掘方法。目前,国内外研究学者已经提出了许多离群点挖掘的方法。本文针对局部离群点挖掘算法性能不佳的问题,针对局部离群点挖掘算法进行了深入研究。本文的内容主要包括以下三个方面。首先,分析了离群点挖掘技术的研究背景及意义,并分析了国内外研究现状,对经典的局部离群点挖掘算法的过程和性能进行了分析和研究。其次,针对基于密度的离群点挖掘效果不佳的问题,引用了三种类型的最近邻居,包括k近邻,反向k近邻和共享最近邻,采用以高斯核函数为内核的核密度估计方法对数据对象的邻域密度进行估计,提出了一种基于高斯核函数的局部离群点挖掘算法。同时,对该算法的准确性和效率进行了分析。再次,针对INFLO算法时间复杂度较高和准确率不高的问题,引入核心影响点集以减少对不必要的数据点进行反向k近邻的计算,同时引入核心邻居对处理后的数据点进行密度估计,提出了一种基于局部密度的离群点挖掘算法。并对该算法的准确性和效率进行了分析。最后,在UCI真实数据集和合成数据集上,实现了本文所提出的两种算法对离群点进行挖掘,并分别与LOF算法、INFLO算法进行了对比实验。通过实验分别验证了两种算法的有效性。
其他文献
高职学生的职业成熟度是指一个用于评价高职学生工作绩效、职业选择、职业发展等情况的指标,本文首先阐述了职业成熟度的内涵与逻辑,然后从不同的方面探讨提升高职学生就业竞
一、卫生保健组织英国由英格兰、苏格兰、威尔士和北爱尔兰四个地区组成,总面积42.42万平方公里,总人口为5900万,其中,极大部分为城市居民(在1995年超过89%).英国是一个老龄
本文提出了一种基于深度学习的应急手势识别算法.首先采用深度图像传感器做手势分割获取应急手势数据集,其次采用肤色分割算法和本文提出的应急手势识别算法做实时性测试.与
目的:鼻咽癌是东南亚及我国南方地区(如广东、湖南、广西和香港等)常见的恶性肿瘤之一。鼻咽癌干细胞在鼻咽癌的发生、发展、转移、耐药及对放化疗的敏感性等方面起十分重要的作
为了响应新课程改革的要求,滑县一中结合本校的具体情况,提出了“一线双循环”教学模式。该模式以学生为中心,倡导学生主动参与,学会自主学习、合作学习,从知识的被动接受者
基层工作面广量大,每一个基层“救火队员”都要雷厉风行、紧抓快干。然而一味追求速度,并不一定能保证取得好的结果,这里与大家分享自己身边的两个小事例。
随着我国经济的高速发展,温饱的生活已不再能满足人们的生活需求,除了丰衣足食的基本需求外,越来越多的人开始注重精神层面的需求。国家也十分注重精神文明的建设,在文化方面
在当前的信息化时代下,为了更好地满足教学的需要,在经济管理专业课程教学中,需要切实加强对教学模式的优化和完善。而“翻转课堂”教学模式能更好地促进学习方式和教育模式
研究了求解具时间依赖边界条件的热传导方程的近似解。首先,对温度边界条件为时间的幂函数的情况,采用标准的多项式温度近似函数,结合热平衡积分法及改进的热平衡积分法,求得
文章介绍了核电站牛腿安装焊缝产生氢致裂纹的状况,通过4组对比模拟试验,分析探讨了其产生的原因,制定了防范措施,对核电站钢结构的焊接具有一定的借鉴意义。