模糊数据的特征选择与动态知识更新方法研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:scientist89
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据产业的不断推进与发展,针对数据资料进行知识发现的重要性与日俱增。海量数据为诸多行业和领域带来“维数福音”的同时,大数据本身所具有的复杂多样性、不确定性以及模糊性等系列问题逐渐显露,使得传统意义下的数据挖掘与知识发现面临诸多挑战。如何从庞杂的数据中发掘有价值的信息与知识显得异常重要。近年来,粒计算理论逐步成为大数据和人工智能领域中一项重要的信息处理工具,通过粒化复杂问题到多个简单的子块,可以实现多层次、多视角、多粒度的全方位复杂问题认知。本课题关注于复杂数据的知识发现方法研究,运用粗糙集、模糊集以及形式概念分析等粒计算方法与手段,在对复杂数据进行模糊化处理的基础上,开展了一系列模糊数据的关键特征提取与动态知识更新方法研究。主要研究工作如下:1.考虑到数据中的特征冗余问题,基于局部复杂熵设计了一种启发式向前的特征选择算法。首先通过引进距离函数构建相似关系并建立局部邻域粗糙集模型,根据近似空间设计度量指标用以衡量模型处理不确定性知识的能力。然后基于不确定性度量与数据决策分布改进信息熵,设计用以特征评价的局部复杂信息熵指标并结合指标性质设计启发式向前的特征选择算法。最后,在UCI公开数据集上通过比较与其他特征选择算法在不同分类器上的分类性能验证该算法的有效性。2.面对模糊数据中对象动态变化时的知识更新问题,从局部角度出发设计了基于广义多粒度粗糙集模型的动态近似更新方法。首先通过定义支持度与包含度函数描述对象相似类与目标集之间的关系,进 在多粒度粗糙集模型中引入参数β∈(0.5,1]构建广义多粒度粗糙集模型以灵活地描述数据中的不确定性知识。通过分析变化对象与原有相似类之间的关系发现更新前后近似空间的变化规律。在对象增加/删除时,根据近似空间的变化规律设计基于局部广义多粒度模型的动态近似更新算法,并通过与静态、全局更新算法在时间方面的对比验证局部动态近似更新算法的有效性。3.针对未标签数据中的个案分类现象,结合形式概念分析理论提出了基于渐进模糊三支概念的增量分类学习机制。在模糊形式背景中引进距离函数,结合邻域思想定义模糊三支概念描述对象与属性之间的关系,考虑认知环境的局限性进一步构建渐进模糊三支概念空间并根据对象与渐进概念之间的相似性设计个案分类学习机制。另外,考虑到数据是不断增加的,在原有分类机制的基础上进一步设计增量学习机制以不断更新知识空间。数值实验结果表明该增量机制的分类效果优于对比的其他模糊分类方法,且概念空间的动态更新机制极大提高了学习效率。
其他文献
多智能体协同控制在群体控制、传感器网络、集体决策和分布式计算等领域有着广泛的应用,受到了越来越多学者的重视。跟踪问题作为协同控制的一个基础问题,它是通过邻居智能体与领导者之间的信息交互,使所有智能体状态都能跟随领导者。然而,由于系统的动力学模型难以用精确的数学公式来描述,这使得多智能体系统的跟踪控制器的设计成为一个挑战。近年来,数据驱动控制在求解复杂非线性系统的控制问题方面展现出了强大的处理能力。
学位
随着现代社会的快速发展,新型电力系统频繁出现在人们的视野。电力系统状态估计作为现代电力系统的运行和控制至关重要的一环,其主要用于系统监控,通过对电表测量值的分析来估计系统状态,并侦查恶意攻击者注入的不良测量值。然而,许多网络攻击,如虚假数据注入攻击,可以绕过传统的检测方法,干扰网络的正常运行。虽然已有研究侧重于在直流状态估计中检测此类攻击,但交流系统中的攻击检测也很关键,取决于交流状态估计在电力设
学位
在地质灾害的治理过程当中,高陡岩质边坡极为常见,主因为此类边坡施工难度大。治理过程需将边坡稳定性和其他因素考虑其中,选择治理方案,保证施工安全,控制施工成本。在此之前,需要对此类边坡展开勘察设计,分析地质灾害成因。因此,对高陡岩质边坡特点进行介绍,分析其地质灾害勘察设计重点和路径,为从事勘察设计领域的人员提供参考。
期刊
备受关注的核方法与自适应滤波(AF,adaptive filtering)算法的结合产生了再生核希尔伯特空间(RKHS,reproducing kernel Hilbert space)的核自适应滤波(KAF,kernel adaptive filtering)算法。虽然KAF算法已作为信号处理领域中重要的工具被广泛应用于处理各种非线性任务,但是其估计量的函数表示会随着输入数据的增多而变得更复杂,
学位
微表情是一种持续时间短、强度微弱的自发面部表情,并且难以通过肉眼进行识别。由于微表情的发生不受人们主观意识的控制,因此能够揭示人们内心真实的情绪。微表情在案件侦破、心理疾病诊断以及商业谈判等场合中,具有重大的应用前景。微表情是由微弱的肌肉运动产生,并且相关的肌肉运动只发生在局部的区域,导致微表情的特征难以被算法模型捕获。在现有的研究中,微表情识别算法并没有达到理想的识别效果。现有的微表情识别算法通
学位
随着多智能体系统向大规模和高复杂度转变,传统的集中式优化方法已经难以适用于这类新型系统。不同于集中式优化方法依赖于中心节点进行通信与计算,分布式优化方法旨在通过智能体之间的协同合作实现全局优化目标,无需中心节点发布指令协调控制所有智能体,从而避免系统的单点故障问题。此外,每个智能体具有一定的自主性、数据存储和处理能力,有效地提升系统的可扩展性和灵活性。凭借上述优势,分布式优化在智能电网、传感器网络
学位
无线通信系统中,信道噪声会导致信息传输错误。因此,需要采用有效的信道编码方案对信息进行检错和纠错以提高传输的可靠性。在信道编码方案中,低密度奇偶校验(Low-Density Parity-Check,LDPC)码作为一种能逼近香农极限的码型,深受学者们青睐。相较于二元LDPC码,多元LDPC码在纠错及抗突发错误方面表现更为优异,近些年已成为信道编码领域的研究重点之一。尽管多元LDPC码在很多方面有
学位
在实际的工程系统中,存在多种约束限制,饱和现象是其中最为常见的一种,忽略系统中出现的饱和现象可能会使系统性能下降甚至不稳定。对饱和系统的研究由来已久,但大多局限于离散或者连续的系统,关于脉冲系统这类混杂系统饱和的研究成果较少。此外在工业实践中,系统难免会受到干扰,所以对受到外部干扰、参数不确定性或者时滞等不稳定因素影响的系统进行鲁棒镇定分析具有十分重要的现实价值。本文将脉冲控制系统作为研究对象,利
学位
自适应滤波(AF,adaptive filter)器因能够根据外部未知环境的变化,自适应调整系统参数以匹配系统的特性,在信号处理、目标追踪与定位、时间序列预测等领域得到广泛应用。在实际应用场景中,因真实环境中所需处理的数据往往具备非线性的特征,线性模型的AF在处理此类非线性问题时表现不佳。核自适应滤波(KAF,kernel adaptive filter)算法通过将核方法引入AF,成为能够处理非线
学位
非凸优化问题作为当前优化理论的研究热点之一,广泛地存在于机器学习、智能电网、无线传感器网络、模式识别等应用场景之中,在当下受到了密切的关注。虽然近年来学者们提出了大量的算法用于解决非凸优化问题,但是这些算法大多存在参数条件较多且复杂、全局寻优能力较差的问题,且在连续时间算法上的研究较少,这极大地限制了非凸优化算法的应用。神经动力学算法作为一种连续时间算法,具有并行计算、便于硬件实现、易于理论分析等
学位