一种基于模式图的频繁模式挖掘算法的研究

来源 :数字化用户 | 被引量 : 0次 | 上传用户:young200909
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘 要】针对目前几乎所有算法都无法在一个包含频繁模式的大数据库中挖掘到极大频繁模式的问题,本文提出一种基于模式图的频繁模式挖掘算法GFPMA(Graph-Based Frequent Pattern Mining Algorithm),算法采用一种自上而下的挖掘方式,将交易数据库转换成模式图,通过两个优化阶段:剪枝冗余团和扩展候选模式,挖掘模式图中的极大团,进而得到Top-N极大频繁模式。
  【关键词】频繁模式挖掘 模式图
  一、前言
  频繁模式挖掘是数据挖掘研究中的一个基本问题。在文献[1]中,首次提出一种模式为巨模式(Colossal Pattern),挖掘指定数量(如,K)的频繁巨模式,并提出了一种基于模式融合方法的算法。文献[2]中提出的算法,旨在寻找Top-K最大频繁模式,文中提出一种极大团算法,该算法以自上而下的方式进行检测。
  在本文中,提出一种新的自上而下的挖掘方法,将交易数据库转换成模式图,通过两个优化阶段:剪枝冗余团和扩展候选模式,挖掘模式图中的极大团,进而得到Top-N极大频繁模式。
  二、基本概念
  (一)基本概念
  (四)结论
  本文中,提出基于模式图的频繁模式挖掘算法是一种新的自上而下的挖掘模式,旨在大数据集中挖掘出极大频繁模式。通过将数据集划分为模式图,找出模式图的最大子图,通过无效团的剪枝和扩展候选模式,Top-N极大频繁模式。
  参考文献:
  [1]神鹏飞,王希武,耿志广,姜樟,王创伟.数据挖掘的方法分类研究[J].价值工程.2012:146-147.
  [2]肖海林,李兴明.层次分析法在通信告警加权关联规则挖掘中的应用研究[J].电信科学.2006(11): 36-39.
  作者简介:陈一心,广西银行学校,助理讲师。
其他文献
目前,成人学生政治思想工作存在着一些问题。根据知识经济时代对创新型人才的需要,探讨成人高等教育中学生政治思想工作创新的途径和对策,很有意义。
把音乐仅仅作为一种技术而不是作为一种文化来理解是片面的。文化素质是高师音乐专业学生非专业素质中最基本、最重要的素质。高等师范应重视和加强对音乐专业学生的文化素质
针对当代大学普遍存在的学习英语情境缺乏的现象,根据西方情境认知学习理论的基本思想,结合教学实际,提出构建英语学习情境的途径和方法,并在实践中加以检验,在大学英语教学
随着城市化进程的发展,开放商逐渐的发现现有的经营模式已经无法获得更高的利益,因而为了谋求更好的发展,开发商在开发建设的过程中开始进行综合考虑,城市综合体的发展已经成
用电按时交费是人们所共知的最起码的商品经济原则.而供电企业长期以来采取“先用电后缴费”的运营模式,这无疑给电费回收工作带来了巨大的风险和不确定因素,如何加强电费回
手机尾号为8790的用户问:种植早春芸豆怎么施肥?专家解答:育苗整地时根据土壤肥力和目标产量确定施肥量,每667平方米施腐熟农家肥3000~5000千克或精制有机肥100~150千克、配方肥(16-