基于集成方法的离群点检测算法分析与研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:alex851123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
离群点检测就是通过多种检测方法找出其行为不同于预期对象的数据点的过程。离群点检测技术已经成功的应用于金融系统的风险控制、医疗疾病的辅助诊断、森林灾害监控、网络攻击预警检测等领域。通过研究者的不断努力,已经有多种离群点检测算法,其中最为经典的离群点检测算法有基于距离、基于密度、基于聚类的离群点检测等方法。目前的这些离群点检测方法已经有效地使用了几十年,它们大都是基于离群点的某一特性进行检测,例如基于密度、距离等,检测效果不是特别好,如何提高离群点的检测效果成为了一个学者争相解决的问题。为了解决相关问题,做了如下工作:(1)本文首先提出了一种名叫累积一致率集成的离群点检测方法(CARE),该算法将多个不同的弱分类器集成在一个模型中,权衡偏差-方差,进而可以提高整个集成检测模型的准确率。在该算法中,离群点检测被认为是一个带有未观测到的标签的二元分类任务,进而可以进行偏差-方差误差分解。现有的离群点集成方法仅包含一个并行框架,并通过组合各独立基本检测器的检测结果来减少方差,但偏差则较高,而CARE结合了并列集成和序列集成,既可以减少方差也可以减少偏差,检测效果明显优于采用一种集成框架的算法。CARE相较于目前最优秀的离群点集成方法,CARE有更高的准确率,同时还能在其他方面与这些优秀的检测方法保持接近。(2)接着提出了一种新的改进的非监督离群点检测集成方法DCSO。传统的静态集成检测方法的基本检测器都是固定的,只是通过改变各基本检测器的权重来提高模型的检测准确率,但是对于那些严重偏离中心的离群点,检测效果则很差。为此DCSO通过评估基本检测器在其定义的局部邻域内的能力,动态地为每个测试实例识别性能最好的基本检测器,进而将识别到的优秀基本检测器集成,然后输出整个模型的检测结果。传统的静态集成检测方法对于离群点邻域的背景值忽略不计,而数据的局部邻域背景值对离群点检测集成影响很大,为此DCSO通过与局部邻域背景值的相似性对单个基本检测器的能力进行排序,去减小背景值对模型的影响。
其他文献
目的:基于天然牙本质制备用于牙本质再生的磷灰石支架材料,研究牙本质的无机成分与功能化的管状结构对牙髓干细胞(DPSCs)形态和分化的影响。方法:制备含有牙本质小管结构和无
近年来,大量的氧化锌纳米颗粒(ZnO NPs )已被应用于半导体领域、塑料助剂、颜料、化妆品等,这很可能造成ZnO NPs 释放到环境中。研究表明,我国现有污水处理厂所用污泥对未被
基于Landau-de Gennes理论,利用松弛迭代方法,研究了一类纺锤状(tactoids)液晶微滴内液晶分子的分布情况。本文主要研究不同条件下纺锤结构中液晶分子的极角、扭曲角的变化情
随着科技的快速发展,人们对生活质量的要求也越来越高,智能家居应运而生。目前市面上的智能家居系统仅能提供一些家居环境的监控和电器的远程控制或者语音控制,但是还没有达到一种真正的智能,需要人来进行控制。随着人工智能的高速发展,将人工智能和物联网技术相结合,能够打造一个真正智能化的家居系统。本文开发了一种基于用户习惯的智能家居系统,即智能家居系统能够根据用户的习惯而造成的不同环境数据进行学习从而对家电进
图像标记的任务是将图像中每个像素标记到它所属的标记类别,它是场景理解的重要步骤和基础,在计算机视觉领域有着重要的作用。行车视角捕捉到的交通场景图像信息能准确的记录
近年来,文本识别与文本检测技术不断发展,越来越多的针对特定数据集的方法被提出。文本识别和检测方法在深度学习时代之前主要是提取低级或中级手工制作的图像特征,这需要繁琐和重复的预处理和后处理步骤。由于手工制作的特征的表现能力有限和过程的复杂性,这些方法很难处理复杂的情况。而基于深度学习的方法优势在于:自动特征学习可以使我们免于设计和测试大量潜在的手工特征。目前,基于深度学习的方法被广泛运用,多场景下的
在基础教育课程改革的当下,合作学习作为一种学习数学的重要方式,被广泛地应用到数学课堂教学中。在《义务教育数学课程标准(2011年版)》中也提出合作学习是数学重要的学习方式之一,是培养学生数学学科核心素养的有效途径。通过分析历年的相关研究,可以从中得出合作学习在数学课堂实践中的确发挥了有效作用,但是,真实的数学课堂应用效果并不理想,原因有多个方面,例如:教师对传统讲授式矫枉过正,指导方法欠缺,教学设
6×6轮式机器人作为特种车辆在物流、医疗、搜救以及运输等方面受到广泛应用。由于轮式机器人工作环境的复杂性,其平顺性在其工作过程中发挥着至关重要的作用。近年来,国家在
目的:脓毒症是炎症反应综合征(SIRS)和代偿性抗炎症反应综合征(CARS)失衡的结果,单核细胞作为重要的炎症细胞贯穿脓毒症病程始末,对脓毒症的发生发展起着重要作用,通过减少单核细胞释放炎症因子将有助于减轻脓毒症的炎症反应。研究证实,IL-33/ST2信号转导通路与脓毒症相关,阻断该通路可减轻机体的炎症反应,本课题旨在研究ST2受体在脓毒症小鼠单核细胞中的表达,IL-33/ST2信号转导通路与单核
情绪调节自我效能感(RESE)是一个人对自己能否有效调节情绪状态的自信心的反映。在个体面对压力时具有非常重要的作用,它能够疏导负性情绪,维护情绪的平稳,促进心理健康。赛前焦虑对运动成绩的影响十分显著,一直以来都是运动心理学领域一个重要的研究方向。合理情绪疗法是学校理性情绪教育的有效方法,能够帮助学生进行情绪管理,应对消极情绪。本论文对高中体育特长学生的情绪调节自我效能感与赛前焦虑的关系进行研究,对