KDD中数量相联规则提取

来源 :吉林工业大学 吉林大学 | 被引量 : 0次 | 上传用户:sun593792820
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文主要研究KDD的一个重要发现任务--数量相联规则提取,KDD的一种数据预处理技术--连接属性离散化,以及相联规则的试验初步--人工数据生成.该文的工作包括:(1)连接属性离散化,这一预处理过程由于影响着数量相联提取的质量,现有的算法对于高偏度数据效果不理想,该文采用抽样和聚类方法解决这一问题;(2)人数据合成.该项工作是相联规则研究工作的试验初步,合成数据将用于测试算法的效率和可伸缩性;(3)在数量相闻规则提取中,应用聚类方法,实现连续属性离散化,提出改进的算法PKCCA.
其他文献
近年来,随着仿真技术在航空航天、信息、生物、先进制造等高新技术领域的广泛应用,仿真系统的规模和结构日益扩大和复杂。仿真应用因此对仿真支撑平台提出了更高的要求。高层
该文是设计与实现的通用的综合办公自动化系统的内容介绍.文中首先简要介绍了办公自动化系统的发展现状、层次划分以及总体目标;接着介绍了办公自动化系统涉及到的关键技术--
该文提出了一种基于Z规格说明的软件测试用例自动生成方法,通过对软件Z规格说明的分析,找出描述软件输入,输出约束的线性谓词,经过线性谓词转换,线性谓词到线性不等式组的转
该文从分布式控制系统(Distrubuted Control System)的基本概念出发,首先介绍了基于PC机群的DCS系统的体系结构,并对DCS组态中的软件组态问题进行了分析,重点在实时数据库生
近几年来,随着科学计算可视化技术的发展,它已被广泛地应用到许多领域之中,医学图像的可视化正是其中的一个重要分支.在口腔修复医学中,CT扫描图像对于帮助医生决定修复体的
该文从第一章到第三章描述了经济可采储量评价研究和软件开发的总体技术思路,以及评价计算和分析的主要技术、软件功能模块的设计和划分,从第四章起对程序设计进行分别论述,
针对90年代以来人工智能(AI)研究逐步转入低潮的局面,文中提出了一些关于人工智能的新思想、新理论,主要研究了人工智能的泛符号机制和知识表示的超拓扑结构,该文的主要贡献如下
该研究提出了一种WWW集群服务器高可用性方案,并在该教研组TH-PARAWEB集群服务器上实现了该方案的原型系统.在集群服务器的请求分配器、局域网和结点机三类对象中,结点机对集
在工程领域中,经常要要用到大量的工程图纸.过去,对于这些图纸的保存和处理非常困难.随着计算机技术的发展,摆脱传统的手工操作方式,实施工程图纸的智能化处理和管理,已成为
该文提出了一种面向图形用户界面(Graphical User Interface,GUI)的应用软件开发模型-I&F模型.