基于遗传算法的长频繁项集挖掘方法

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:tklyzh1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据挖掘中,关联规则的挖掘是一项核心内容,且规则的生成主要集中在如何寻找频繁项集上。一般情况下,寻找频繁项集是困难的,且项数越多越难,而最长频繁项集隐含了几乎所有的频繁集,因此,寻找频繁项集就转化为寻找最长频繁项集。文中利用遗传算法的全局最优和海量数据处理性来搜索最长频繁项集,该法只需扫描一次数据库,大大节约了时间。实验也说明了该算法的可行性。
其他文献
为了降低低速非相干扩频信号的同步时间,提出了一种分阶段的同步方法。该方法将整个同步过程分为伪码搜索与捕获、频率细估计、伪码跟踪、定时和载波相位跟踪几个阶段。其中前
通过研究区域地球化学特征及预查区地质特征,发现区内Au、Ag标准离差及变化系数较大,说明Au、Ag元素在区内分布不均匀,易富集而成矿,区内发现有那更康切尔、永巴埂、克得休玛
P2P业务流量在对互联网应用起巨大推动作用的同时,也带来了因资源过度占用而引起的网络拥塞以及安全隐患等问题,妨碍了正常的网络业务的开展。为了保证网络能正常有序的运行,有
塔里木盆地西缘乌恰地区玛依喀克海相砂岩型铜矿位于克孜勒苏河以南,大地构造位置属于帕米尔逆冲推覆构造带。本次在古近系海相沉积地层中发现3套稳定含矿层位,矿体主要受层
分析了Bottleneck算法的不足,指出在路段较为拥挤的情况下该算法中因不具备预测机制而产生的时滞会引起控制误差以及主线拥挤时会造成交通流大幅波动等,产生不足的原因是算法的