【摘 要】
:
伴随信息技术和传感器技术的进步,数据的采集方式越来越多样化,获得数据大为方便。面对海量数据,如何挖掘出数据背后的感兴趣模式成为众多学者研究重点。挖掘移动对象背后周期模
论文部分内容阅读
伴随信息技术和传感器技术的进步,数据的采集方式越来越多样化,获得数据大为方便。面对海量数据,如何挖掘出数据背后的感兴趣模式成为众多学者研究重点。挖掘移动对象背后周期模式为研究移动对象提供了理论依据,如研究动物习性,也可以根据发现的周期模式做出合理的决策,如交通指挥等。本文主要研究移动对象周期模式挖掘方法。为了解决组合爆炸、稀有项问题、不能满足闭包条件以及效率低下等问题,提出一种具有向下闭包特性的闭包多限制条件树算法(Multi-Constraint Closure Conditional Tree,MCCCT)。算法为不同模式设置不同限制条件,解决了组合爆炸和稀有项问题,提高了挖掘效率。针对模式支持度和周期距离难于获取的问题,根据每个模式出现频数动态获取属性值,增强了挖掘算法的灵活性。为防止噪音等不确定因素的影响,引入基于相似度的模式匹配算法,使模式挖掘更加具有健壮性。论文对提出的方法采用公开移动对象数据进行实验和分析,根据每个项出现频率动态获取支持度阈值和周期距离阈值。实验表明提出的方法能够挖掘出稀有项,抵御一定的噪音干扰,获得更高质量的周期模式,并且满足闭包条件,解决了传统方法不能解决的问题。针对目前周期方法挖掘出的模式存在很大冗余性,挖掘出的周期模式往往不是用户感兴趣的,提出一种无冗余的周期模式发现算法(Non-Redundant Period Patterns,NRPP)。该方法同样引入多支持度限制条件,提高筛选质量。同时引入相似因子,使得相似模式被剪枝,减少了冗余模式,降低冗余性。采用公开移动对象数据进行实验,结果表明,该方法得到的周期模式较传统方法得到的周期模式质量更高、更简洁,不存在相似模式,降低了冗余性,弥补了传统方法的不足。
其他文献
矿井提升机故障诊断对煤矿安全生产至关重要。提升机故障诊断的方法有很多,模糊C均值方法和谱聚类是两种典型方法。传统模糊C均值方法因随机中心的不确定性而容易陷入局部最优
网格是近年来发展起来的新兴技术,并已成为越来越重要的研究领域。网格安全问题是网格计算中的一个核心问题,对网格安全问题的研究与分析同样刻不容缓。网格环境由于具有若干
声纹识别是语音识别的一种,它根据测试语音来辨别说话者的身份。声纹识别在司法查证、机要保密、电子商务等领域有着广泛的应用前景。从具体应用的角度可将声纹识别分为说话
收费稽查选案是收费稽查的首要环节,它的任务是根据科学的选案指标,对各类收费信息进行综合分析、归集分类,在众多的收费单位和部门中确定待查对象,为收费稽查工作提供方向和目标
利用现代信息技术改造和提升现有制造模式是符合我国制造业国情的一条发展之路。企业信息化集成系统(Enterprise Information Integrated System,EIIS)理论正是应这种要求而产
随着科学技术的飞速发展和广泛应用,图像信息的存储和传输在社会生活中的作用越来越突出。在医学领域,数字化医学成像设备得到了广泛的使用,产生了海量的医学图像数据,这对医
随着计算机网络的快速发展,智能计算、面向服务的体系架构等新技术和新概念的广泛应用,有效地促使人们实现计算机支持与协同工作。工作流技术作为计算机完成协同工作的抽象化手
近年来,随着网络技术的迅猛发展,宽带接入逐渐成为很多家庭应用的必要设施之一,它也是电信运营商大力推广的应用手段,当前广泛使用的宽带接入方案如ADSL,小区宽带,xDSL和Cabl
随着信息技术的广泛应用,我们遇到了很多关于安全性和私密性的问题。其中访问控制(Access Control,AC)是解决这类问题方法之一,同时AC被认为是解决信息安全通信的主要方法。传
随着通信与网络技术的发展,网络视频服务已逐渐成为人们日常生活中不可或缺的一部分。然而,由于通信网络的不可靠性,错误和分组丢失情况随时可能发生。这就要求视频编码算法