论文部分内容阅读
云理论是以研究定性定量间的不确定性转换为基础的系统处理不确定性问题的一种新理论,包括云模型、虚云、云运算、云变换、不确定性推理等内容。云模型是语言值描述的某个定性概念与其数值表示之间的不确定性转换模型,它将定性概念表达以及定性定量间转换的模糊性和随机性集成到一起,是云理论的基础。将数量型属性转换为布尔型属性是数量型属性关联规则采掘的主要方法,传统的划分方法由于不能反映数据间的实际分布规律或者是划分的边界过硬,使得最终都不能得到令人容易理解的关联知识,提出了一种基于云模型的新划分方法—云变换,可以有效地根据数据的实际分布将数量型属性的定义域划分为多个基于云的定性概念,这种划分摒弃了以前的硬划分,使得到的结果除了保留传统硬划分所具有的优点以外,也更加符合实际的数据分布和人的思维方式,从而最终得到概括的、易理解的、有效的关联规则。为了发现强关联规则,在较高的概念层上泛化了属性值,同时允许相邻属性值或语言项间有重叠。基于云模型的软划分比较接近人的思维,使发现的知识具有稳健性。将基于云模型的概念划分方法与Apriori算法结合起来初步显示了云模型在关联规则挖掘的有效性。云关联规则提取就是产生置信度与支持度分别大于用户定义最小值的所有关联规则。所做主要工作如下:1、对现存关联规则挖掘中存在的问题进行分析,特别是对数量型属性定义域的划分问题进行分析。数量型属性关联规则的挖掘方法是将数量型属性的定义域通过区间划分的方法转换为布尔型属性,然后再利用布尔型关联规则的挖掘算法进行挖掘。但这样会带来一个明显的问题,即数量型属性的定义域该如何划分。2、对云模型进行研究,用软件方法实现了云发生器,包括正向云发生器和逆向云发生器,正向云发生器的核心技术是用中心极限定理生成正态随机数;并且对随机数产生的原理进行了阐述。正向云发生器可以将定性语言转化为定量数据,可以将语言量化;逆向云模型实现数值和语言值之间的随时转换,把逆向云发生器运用到数据开采中。3、提出了基于云模型的关联规则算法。云模型应用到关联规则的挖掘中,实现了概念的软划分,更符合人的思维方式。云变换的实质是采用云模型来拟合空间数据分布的概率密度函数,即计算原子概念的云模型的数字特征值。4、利用正态云模型来对数量属性定义域进行划分,并且利用云关联规则的进行挖掘,根据挖掘出的关联规则进行预测。