分布式关联规则挖掘的方法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:lxj364199013
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是当前KDD中的一个重要领域,而关联规则的挖掘是数据挖掘的一个重要组成部分。Internet/Intranet的高速发展促进了数据库技术的深入应用。由于安全及通信成本、效率等多方面的原因,大量的分散数据不可能集中起来处理。分布式关联规则的挖掘就是在这样的背景下提出的。本文在分析和介绍了关联规则挖掘的基本概念和方法以及分布式关联规则挖掘方法和技术基础上,提出了中心结点结构的分布式关联规则挖掘的算法(C-DMA),分布式多层概念的关联规则挖掘算法,以及分布式元学习可变精度关联规则的挖掘算法;并且,在分析和研究了分布式关联规则挖掘中常见的数量型关联规则、关联规则的兴趣度问题的基础上提出了数量关联规则的聚类划分方法以及兴趣度过滤方法。本文的主要工作和结论如下:(1)对于分布式关联规则挖掘问题,目前的主要算法是CD算法和FDM算法。这些算法都是基于网状结构的分布式关联规则挖掘算法。但是,在实际的网络应用环境中,用户基于成本和管理等方面的需要,使用的网络结构往往是星型结构的,所以CD算法和FDM算法在网络结构和实际的网络结构不相适应,本文在CD算法及FDM算法的基础上提出以中心结点结构的分布式关联规则挖掘算法,并且从算法分析和仿真试验两个方面证明了算法的有效性和可扩展性。(2)在分布式挖掘过程中,分布式数据库中存在着大量的数量属性,这些数量属性的处理好坏,直接影响着关联规则的挖掘效果和效率。本文在分析了数量型属性划分的基础上,提出了改进的FCM聚类及其利用遗传算法优化FCM聚类来处理数量型关联规则的方法。(3)在实际的关联规则挖掘应用中,多层概念关联规则是用户经常考虑的问题。本文在设计并分析了单数据库多层关联规则挖掘算法的基础上,提出了在多层概念上进行分布式关联规则挖掘的算法。仿真试验表明,算法是有效的。(4)由于大量数据的分布,提高分布式关联规则挖掘的效率是十分重要的一个环节。本文在Sampling算法的基础上提出了分布式元学习可变精度关联规则挖掘算法。算法分析表明,该算法是有效的。(5)在关联规则挖掘中,关联规则结果的评价是关联规则应用的关键。本文在详细分析了目前国内外关联规则兴趣度评价的基础上,提出了利用Klementinen模版理论与相似性理论向结合的关联规则结果的处理算法。
其他文献
学习方式是学生在完成学习任务时基本的行为和认知的取向.它不是指具体的学习策略和方法.而是学生在自主性、探究性和合作性方面的基本特征。
色彩是人们生活中常见的元素,丰富多样的色彩装扮了人们的生活,丰富了整个世界,也赋予了事物生命的意义。建筑室内是人们工作和生活中接触最频繁的场所,恰当运用色彩元素能够
<正> 你想过有一天你能命令电视吗?当你从电视上听到一首好歌时,可以让电视把歌词打印出来;当你欣赏篮球赛时,可以让电视同时把各队的技术统计告诉你;当节目看到一半,你忽然
摩尔斯密码(Morse Code)是以点与线组成的.它的长度各有规定,但是没有一个发报员能做到毫厘不差.当发报员发送信息,尤其是用"平键"(straight key)或"甲虫"(the bug)这种老式
针对粒子群优化算法(PSO)在解决复杂的高维优化问题时容易陷入局部最优和收敛速度慢的问题,结合模式搜索算法较强的局部搜索能力,提出一种引入模式搜索算子的粒子群优化算法(
山东省长岛县庙岛塘海域.大自然正在这里描绘着一幅幅奇景:10多个小岛突然浮现在海面上,有的呈倒三角状,有的呈垂直状,有的呈蘑菇状;岛北端的航海博物馆,如凌空飞架的蓬莱仙
目的:PICC置管时套管内芯用注射器连接预防出血的效果观察。方法:将40例行PICC的肿瘤患者随机分为两组,试验组20例,对照组20例,试验组使用PICC置管时套管内芯用注射器连接,对照
<正>随着外科微创化的发展,腔镜手术占本院外科总手术量的60%左右。目前,本院外科各临床科室将自己买的器械存放到手术室,由手术室护理人员进行器械的清洗灭菌,而器械的清洗
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield