前缀树相关论文
本文采用一种基于滑动窗口的流数据频繁模式算法DSFP-SW(Data Stream FrequentPattem based-on Sliding window)进行批处理式挖掘......
近些年基于位置服务的软件便利人们生活的同时,也带来了隐私泄露的风险.针对这一问题,提出一种基于噪声前缀树结构的轨迹数据发布......
数据流是近年出现的一个新的应用类型,具有连续、无限、高速等特点。典型的数据流包括:无线传感器网络应用环境中由传感器传回的各种......
传统的聚类技术都是使用数据所有的属性来发现簇。但随着聚类技术应用范围的不断扩大,特别是近年来对气候研究、心理学、电子商务、......
序列模式挖掘在Web日志挖掘、自然灾害预测、DNA和蛋白质序列模式发现等领域有着广泛应用。基于频繁模式增长的。PrefixSpan是目前......
随着对Web服务技术研究的不断深入,为了实现智能化的Web服务提供,出现了语义Web服务。语义Web服务是Web服务和语义Web结合的产物,它的......
近年来,以智能手机等移动设备为载体的移动应用得到了广泛使用,并逐步影响人们的生活方式。人的移动性带来的位置行迹不仅记录了人......
轨迹数据对于智慧城市和“互联网+”建设有着重要作用,然而轨迹中包含了大量的个人隐私,对轨迹数据集的发布进行隐私保护刻不容缓......
近年来,数据库技术的广泛应用使得公司、政府和科学组织等机构都积累了大量的数据。如何分析和理解这些数据并为未来的决策提供支......
近年来,随着信息技术的快速发展,个人和企业产生了大量的数据信息。为了向用户提供更好的个性化服务,各种社交组织更加热衷于收集......
现有的基于位置服务的系统已经收集了大量用户轨迹数据,如果这些数据未经任何处理,数据管理员就直接发布,用户的个人隐私就会被泄......
系统日志记录了系统的运行信息,是开发人员检测系统异常必不可少的数据.异常检测的首要步骤是将非结构化日志解析为结构化的数据,......
目前,中小词表的孤立词识别系统的性能已经可以达到比较令人满意的效果。但是,随着词农的增大,语音识别系统的搜索空问迅速膨胀,导......
对网络流量进行识别时,利用标准端口和采用匹配报文载荷关键字的方法是网络监测常用手段,但随着网络技术的发展,上述两种方法具有......
随着B2B等应用的推广和普及,可以设想不久的将来大量的商业数据将存储在XML数据库中.因此,直接对XML数据进行联机分析是一个值得研......
随着信息技术的发展,工业和互联网紧密结合,因此,保证工业网络的安全是十分有必要的。然而,在实际的工控系统中,由于工控节点的资......
挖掘最大频繁模式是多种数据挖掘应用中的关键问题。提出一种挖掘最大频繁模式的快速算法,该算法利用前缀树压缩存放数据,并通过调......
采用剪枝方法,通过对Next Closure算法的改进,提出一种基于剪枝的概念格批处理算法Prun—NextClosure,减少了概念格构造过程中闭包运......
传统频繁项集挖掘算法的执行效率较低。提出了一种基于矩阵与前缀树的频繁项集挖掘算法MPFI,能快速地挖掘事务数据库中的频繁项集......
频繁模式的并行挖掘算法是数据挖掘中重要的研究课题。目前已经提出的并行算法大多是基于Apriori或基于FP—tree。由于两者的固有......
在管理信息系统的层次分类树中,为了快速查询分类信息并高效地生成层次分类子树,提出了一种基于前缀编码的先根遍历树生成算法。该......
序列模式挖掘在Web点击流分析、自然灾害预测、DNA和蛋白质序列模式发现等领域有着广泛应用.基于频繁模式增长的PrefixSpan是目前性......
为了使树生成算法更为通用且效率更高,提出一种基于前缀编码的树生成算法.算法中的节点采用前缀编码的数据结构,便于用户对树中节......
如今,随着现代科学技术尤其是计算机技术的快速发展和信息系统的不断普及,我们早已置身于大数据时代。面对如此庞大的数据量,人们......
通过研究项集之间的关系,发现大项集之间存在着一种特定的关系,即k-项集一定是由一个(k-1)-项集加上一个单独的项构成的。基于这种项集......
挖掘和更新最大频繁模式是多种数据挖掘应用中的关键问题。之前的许多研究都是采用Apriori类的候选生成-检验方法或基于FP-Tree的......
提出了一种基于树型结构和加权墒的中文高频词提取算法。简单介绍了中文的树型结构和加权信息熵,详细叙述了算法的原理和设计步骤,并......
针对布尔型关联规则不能表达挖掘对象中模糊信息的关联性,给出一系列有关模糊关联规则的定义,并提出一种基于前缀树的模糊关联规则挖......
为使包分类具有快速点定位和良好的可扩展性,结合cross-producting表与线性查找提出一种新的基于计算几何的流分类算法。该算法通......
对网络入侵检测系统(NIDS)中复杂正则表达式匹配电路进行改进和优化。为达到最大吞吐量和最小的单位字符占用资源量,设计利用预译码、......
递归遍历、条件FP-Tree构建与超集检测是多数基于FP-Tree最大频繁项集挖掘算法的主要性能瓶颈。为此,提出一种基于Nodeset的最大频......
在网络入侵情报协同分析过程中,告警数据的共享使被攻击者面临隐私泄露的风险。针对现有告警信息隐私保护方法无法应对背景知识下......
随着网络和其它信息技术的广泛应用,网络系统的安全变得至关重要。入侵检测系统是保护网络系统安全的关键技术和重要手段,但现行的......
用电信息大数据上的OLAP查询涉及数据量大,具有多表连接操作频繁、SQL结构复杂等特点,传统关系型数据库面对该类应用,表现出可扩展......
用电信息大数据上的OLAP查询涉及数据量大,具有多表连接操作频繁、SQL结构复杂等特点,传统关系型数据库面对该类应用,表现出可扩展......
高性能IP路由器使用复杂的转发表查找算法优化查找时间、存储空间和更新时间.在对ORTC压缩算法及信息熵理论研究的基础上,提出了一......
随着计算机技术在社会各个领域的广泛应用,人们对信息系统的依赖程度越来越高。面对数据丰富而信息匮乏的困境,在统计学、数据库技......
从语音识别技术诞生以来,识别率就是评价语音识别系统的一个重要指标,研究人员一直致力于减少语音识别系统的错误率。近年来,随着......
针对用户的日常移动轨迹进行挖掘,可以有效地发现隐藏在用户生活中频繁出现的移动规律,即用户频繁移动模式,提出了一种基于PrefixS......
在已有模式的基础上,该文挖掘出了新的模式,减少了挖掘原始数据库次数,指出了IncSpan+算法存在的问题,说明了基于半频繁模式的增量......
多示例学习为中文Web挖掘提供了一种新的思路.提出中文Web目录页面推荐这种特殊的Web挖掘任务,并且将其转化为多示例学习问题来解......
期刊
针对搜索日志的发布泄露用户隐私的问题将差分隐私引入到搜索日志中,提出了一种满足ε-差分隐私的隐私保护策略算法,使得搜索日志......
针对现有用户行为序列模式挖掘方法的单一支持度局限性问题,提出一种基于前缀树结构的多支持度序列模式挖掘方法。设计一种多支持度......
针对频繁项集挖掘时间与空间效率低的问题,提出一种基于前缀树的高效频繁项集挖掘算法,通过对事务集进行预处理,创建索引表并分配索引......