【摘 要】
:
随着计算机科学与技术的进步,信息技术领域在最近几十年得到了迅猛发展,人们使用信息技术手段在各领域均产生并积累了海量数据,由于数据量以及维度巨大,传统的数据分析方法已经并
论文部分内容阅读
随着计算机科学与技术的进步,信息技术领域在最近几十年得到了迅猛发展,人们使用信息技术手段在各领域均产生并积累了海量数据,由于数据量以及维度巨大,传统的数据分析方法已经并不奏效,此时,数据挖掘技术应运而生。数据挖掘是从海量的实际应用数据中,挖掘出隐藏的、难以用普通手段发现的,但对现实生活中某些领域的应用具有实际价值的信息的过程。数据挖掘的主要任务之一关联规则的作用在于揭示项集之间的有趣联系,已广泛应用于市场营销、医学、金融、生物等各个领域。FP-growth算法作为关联规则挖掘算法中的一个经典算法,由于不需要产生候选项集,运行效率较Apriori算法有了一定程度上的提高,从而得到了广泛应用。 本文针对FP-growth算法产生FP-tree太多、太大,占用内存太多,以及向本地及数据库服务器申请查询重复数据给数据库服务器增加负担的问题,提出了NFP-growth算法。NFP-growth算法通过构造基于支持度二维表的方式存放各项的支持度计数,并且采用基于频繁项集划分的思想,分别得到每个频繁项的数据库子集并从二维表中获取支持度直接构造条件FP-tree,挖掘以该项为结尾的频繁项集。减少了FP-tree的产生数量并将经典FP-growth算法在此过程中遍历每项前缀路径的次数由2次减少为1次。 针对FP-growth算法产生频繁项集的过程中会产生大量大于支持度阈值,但人们并不感兴趣的频繁项集的问题,本文在第四章提出的NFP-growth算法的基础上进一步提出了KNFP-growth算法。KNFP-growth算法在NFP-growth算法中融合了关键项抽取KEEP-growth算法的思想,通过划分关键项表和非关键项表,在构造每一项的条件FP-tree后,使用KEEP-growth算法代替FP-growth算法挖掘频繁项集,依靠关键项表的约束,仅输出包含关键项的频繁项集,消除了无意义的频繁项集的挖掘。
其他文献
如今,随着分布式网络应用范围的扩大,对传统分布式网络提出了确定性、实时性以及容错性的新需求。为了满足这些需求,早期的研究人员提出了时间触发网络的概念,将网络事务由传
作为增强技术的一个分支,盲源分离已经得到广泛的关注。其在诸如图像处理、语音信号处理、医学信号处理、雷达信号处理中的广泛应用更使其成为当前的研究热点。当观测信号少
正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)是一种多载波调制技术,该技术具有很高的频谱利用率,而且能有效地对抗冲激噪声和多径衰落。近些年来,OFDM技术
自主式水下机器人(Autonomous Underwater Vehicle),简称AUV,是一种在具备自主导航和规划能力的基础上可进行水下环境探测和海洋开发的运载平台,可代替人类到危险或者难以到达的水
在21世纪的今天,飞速发展的互联网给人们日常生活带来了巨大的便利,各行各业都在向互联网化靠拢。同时,用户在网络上的行为足迹大多被记录在Web日志文件中,通过对这些文件进
近年来,航空电子网络得到了迅猛发展,在航空航天领域其地位变得越来越重要。时间触发网络在物理链路中可以避开数据帧竞争的情况,为网络中提供强实时性。而航电网络对实时性
据不完全统计,目前已有数百种模式识别与图像处理(PRIP, Pattern Recognition and ImageProcessing)系统活跃在各个领域,许多已经作为商品推向市场。越来越多的识别算法被应用
认知无线电(CR)是一种能够智能感知周围环境,并动态地做出系统参数调整,从而适应环境变化的通信技术。随着无线通信的发展,频谱资源变得日益匮乏,而利用CR技术可以很好地解决
不可再生能源不断的消耗以及世界各国对于电力依赖,使得全球各国都将目光聚集于新能源发掘使用及新型电力供应系统的研究开发,因此智能电力网络架构是电力系统智能化的必然需求。智能电网通信网络是智能电网核心架构,其邻域网是广域网与家域网之间互通信的重要桥梁,邻域网中节点性能及存储能力受限,存在故障中断或加入退出的可能性,同时通信环境复杂多变,链路质量得不到相应保障,因此高效、安全、可靠的通信路由协议是邻域网