论文部分内容阅读
本文以水域监测信息融合为研究背景,通过基于数据挖掘的信息融合,采用粗集理论结合因果连接网络和多元统计的方法,为解决信息融合系统中信息不完整,不确定,数据量大,来源复杂的困难,围绕着信息的提取研究海量多类别信息融合中信息提取和模式分类、融合知识库的建立、不确定性条件下的信息推理以及快速搜索算法,融合系统信息的分析和表达,探索多信息源条件下获取信息的有效方法和实现技术,为高效、合理利用数据提供理论和技术基础。 本文分别采用粗集方法、因果连接模型方法和多元统计分析方法研究了基于数据挖掘的信息融合问题。在粗集方法方面,针对信息融合系统应用中数据不完整(不相容甚至互相矛盾)、缺少先验知识的特点,提出并讨论了基于粗集理论建立融合规则模型的方法。针对信息融合数据库动态库建立问题、粗集约简的缺点,在信息熵的概念的基础上对粗集约简做了改进。在因果连接模型方法方面,引入了整合主观先验知识和统计推理的因果连接模型,处理融合系统中的不确定性因素。为了降低因果连接模型的复杂程度,减少模型“节点”数,压缩搜索空间,在粗集约简概念的基础上,提出了“统计”约简的概念和相应的约简搜索算法。详细讨论了利用统计约简来筛选模型“节点”,用因果连接模型进行不确定性推理的信息融合方法。在多元统计分析方法方面,拓宽粗集“约简”的概念,从信息提取的角度,采用统计筛选、主成分分析(PCA)的方法讨论属性选择、属性压缩在融合对象模式分类中的应用。此外引入因子分析和旋转对融合系统中属性之间的关系做了定量分析。还介绍了利用对应分析来分析信息融合系统中属性之间的关系,融合对象状态之间关系,以及属性和状态之间关系的直观图示法。 围绕着这些问题,本论文完成了以下的工作: 1.针对多传感器数据融合系统应用中存在的问题,提出了基于粗集理论建立数据融合规则模型的方法,在无对象模型知识的前提下,基于数据本身给出了融合对象的规则模型,建立了融合对象因果事件的知识库;采用粗集结合信息熵理论来分析剔除冗余属性,克服了粗集约简的困难,合理利用了不确定性知识。 2.提出了基于粗集动态建立规则模型的方法,克服了小数据库建模的困难和粗集约简的缺点。 3.针对粗集约简易受数据噪声干扰,难于发现属性间不确定性关系的问题,提出了统计粗集约简的概念和方法。 4.为处理不确定性推理、“多类别”判别问题并合理整合先验和后验知识,在数据融合系统中引入了因果连接模型。在粗集约简的概念下,结合粗集和因果Vlll 浙江大学博士学位论文连接模型提出了基于属性选择的因果连接模型搜索算法,即在统计约简的概念下,对构成因果连接模型的节点进行了选择,克服了粗集约简对数据噪声敏感的缺点,减少了模型“节点”数,降低了因果连接模型的复杂程度,压缩了搜索空间。 5.为了从大量信息中提取有用信息,并克服数据噪声的影响,采用统计筛选和主成分变换方法研究了信息冗余问题,在粗集约简的概念上提出了基于统计属性筛选和主成分属性变换模式识别方法,并对各种方法做了比较。 6.为了解诀融合模式识别中,同时减少实际使用的属性数和算法使用属性数的问题,提出了“统计属性筛选一PCA变换一模式分类”的方法, 7.为了定量分析信息融合系统中不同信息源之间的关系,找出描述系统本质特征因素的方法,并依据各因素重要性对各个因素进行评估,提出利用因子分析和旋转对监测属性进行了分析的方法。 8.提出并探讨了利用对应分析来描述属性和属性、属性与监测对象状态之间的关系的直观图示法。为深刻了解多传感器监测指标和监测对象状态之间的关系,把握监测系统的内在规律提供了方便。