不产生候选项集的TOP-K高效用模式挖掘算法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:abczvw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前TOP—K高效用模式挖掘算法需要产生候选项集,特别是当数据集比较大或者数据集中包含较多长事务项集时,算法的时间和空间效率会受到更大的影响.针对此问题,通过将事务项集和项集效用信息有效地保存到树结构HUP—Tree,给出一个不需要候选项集的挖掘算法TOPKHUP;HUP—Tree树能保证从中计算到每个模式的效用值,不需要再扫描数据集来计算模式的效用值,从而使挖掘算法的时空效率得到较大的提高.采用7个典型数据集对算法的性能进行测试,实验结果证明TOPKHUP的时间和空间效率都优于已有算法,并对K值的变化保
其他文献
在信息技术中,计算和数据成为科技创新的第三和第四种范式。只有令大数据与大计算融合,利用超级计算和云计算等云编程、云设计云财务的协同服务平台,用技术打通设计研发、生产财
本文提出一种基于DCT的自适应变码长的变换域图像压缩算法,并给出实现任意长度序列DCT的FFT的汇编源程序。本算法的基本原理是,在图像快变换区分配长码,在慢变换区分配短码。
文章以郑州市民文化服务区地下交通工程为例,对其开挖前现状进行综合分析,通过对市民大道站3号出入口采用加强地层超前支护及加固、地下构筑物保护、CRD法加强措施、初支背后
“雄赳赳,气昂昂,跨过鸭绿江……”,这首形成上个世纪50年代的《中国人民志愿军战歌》里的鸭绿江,让以后半个多世纪的中国人都知道中朝界河——著名的鸭绿江。抗美援朝与断桥鸭绿
主要介绍自动定量包装机的结构组成、主要功能、工艺过程及PLC控制系统的硬件组成及软件设计,系统的通用性较好,定量范围广、准确度高、速度快、可靠性好,可为用户推广使用。
对新闻数据可视化技术进行了研究,并充分整合数据挖掘、文本分析、分布式存储及可视化技术,设计实现了一个新闻数据可视化系统。它把采集到的新闻数据进行分类,并结构化存储,
研究性学习是培养大学生人文精神的一种有效办法,它通过以下几方面来体现:关注尊重人的意愿是培养人文精神的基础;提供促进发展的条件是培养人文精神最现实的体现;把个人、群体与
为满足市场需求,在1×19结构系列大规格高强度光圆预应力钢绞线的基础上,研制出一种高握裹力、高强度、低松弛1×19S—21.8多层丝三面刻痕预应力钢绞线。成品性能超
小学语文课堂教学语言的艺术性、教学氛围的人文化、教学悬念的设置、教学手段的变化、师生的情感沟通以及评价语言的趣味性,都对语文教师提出了更高的素质要求。可见评价语
国家交通建设和社会发展过程中,对于基础设施的建设是发展任务中重要的一部分,而为了将横向扩建变为纵向建设,部分基础设施已经将建设的范围向地下方向发展,这就导致隧道工程