【摘 要】
:
关联规则数据挖掘是数据挖掘的一个非常重要的研究课题。自1993年Agrawal引入关联规则概念和提出第一个关联规则算法以来,由于其巨大的商业价值以及研究的理论价值,诸多研究
论文部分内容阅读
关联规则数据挖掘是数据挖掘的一个非常重要的研究课题。自1993年Agrawal引入关联规则概念和提出第一个关联规则算法以来,由于其巨大的商业价值以及研究的理论价值,诸多研究人员对关联规则挖掘的算法进行了广泛的研究。关联规则挖掘的难点在于其挖掘对象是海量的数据,由于Agrawal算法需要对数据库的多次扫描,因此在真正的海量数据库挖掘中没有实用价值;而FP-树增长算法,相对于Apriori算法来说,算法效率快了一个数量级,但算法需要消耗较大内存,对海量级数据库来说算法在实现上存在一定的困难。当前国内外研究关联规则的文献很多,但大多数集中在对上述两个算法的改进上,没有实质和有效性的算法出现。本文研究的主要内容是关联规则的挖掘算法及其系统实现。为提高算法效率,通过研究数据库中数据之间内在关系,并使用特定的数据结构来研究关联规则挖掘算法,本文提出一个基于数组结构的A-Mine算法和两个基于数据增量变化的挖掘算法。实验数据表明,考虑数据结构和数据间关系的关联规则算法,在实现上和效率方面都有极大的改进。本文在下面三个方面对关联规则挖掘展开研究并取得一些结果:1.在大量研究经典关联规则挖掘算法(Apriori算法和FP-Growth算法)相关文献的基础上,使用了一种简单的数据结构----数组,提出了一种基于数组的改进的关联规则挖掘算法----A-Mine算法;2.当挖掘数据库进行动态更新时,通过研究数据之间的内在关系,利用原有的挖掘知识来高效地挖掘新的关联规则,结合两种经典算法提出了IUAMAR算法和IUA_FPKB算法;3.针对国内目前关联规则挖掘算法实现方面的研究较少,本文开发了一个基于超市数据库的简单的数据挖掘系统,提出了一系统框架,实现了相应的算法,并对算法的性能进行分析和评价。
其他文献
目的 比较分析吉非替尼对不同体能表现、既往不同化疗次数、有或无脑部转移病灶的非小细胞肺癌患者的治疗结果。方法 总共有 76例患者参加试验。结果 患者的疾病控制率为
民事诉讼回避制度作为程序公正这个宏观课题的重要内在要求,是实现诉讼整体公正的重要保障。在现今这个愈来愈重视程序公正的国际大潮流背景下,此制度引起大多数法制发达国家
纳撒尼尔·霍桑是19世纪美国浪漫主义的代表作家。他开创了美国小说中富有象征性的浪漫形式,用天才的艺术才能创造出多部具有审美价值的传世佳作。霍桑天赋的才能与他善于思
法律监督是一个重要的法学基础性课题,而宪法监督模式研究又是法律监督理论的核心。如何监督和保障宪法的实施,这是世界各国宪政建设实践中的一个十分重要的问题。自从宪法作
在以二苯甲酮(BP)为光敏剂,三羟甲基丙烷三甲基丙烯酸酯(TMPTMA)为交联剂存在下,研究了聚氯乙烯的紫外辐射交联过程;考察了光敏剂和交联剂的用量、光辐照温度、光照时间、光
背景与目的非小细胞肺癌(non-small cell lung cancer,NSCLC)靶向治疗越来越受到关注,吉非替尼和厄洛替尼均被推荐用于存在表皮生长因子受体酪氨酸激酶(epidermal growth fac
背景与目的转录因子Twist是上皮-间质转变(EMT)过程中的重要调控因子,在肿瘤进展中发挥重要作用。本研究的目的是检测Twist在肺癌组织和细胞系中的表达情况,并探讨其与肺癌的
农村中小学布局调整是我国近几年来优化农村教育资源配置,促进农村义务教育改革发展的一项重要政策,绝大多数的民族贫困地区都相继进行了农村中小学布局调整。通过调整,确实解决
崔致远(857~?)是9世纪后半期的新罗入唐留学生,他在唐考取了宾贡进士,先后在唐和新罗任过官职,其间撰写了大量的公文,创作了一定数量的诗篇,无奈仕途屡受挫折,最后归隐。他是新罗著
随着科学技术的迅速发展,知识经济已成为当今社会的主要特征。如何把学生培养成为高素质、全面发展的人才,就成为摆在我们每个教育工作者面前的重要课题。体育作为素质教育的重