【摘 要】
:
序列模式挖掘是从数据库、数据仓库或其他数据集中提炼频繁序列的过程.在序列中加入各种约束条件能够发现更多实用的模式.滑动窗口、最大间隙、最小间隙和最大跨度等四种参数
论文部分内容阅读
序列模式挖掘是从数据库、数据仓库或其他数据集中提炼频繁序列的过程.在序列中加入各种约束条件能够发现更多实用的模式.滑动窗口、最大间隙、最小间隙和最大跨度等四种参数基本概括了时间约束的各种形式,称之为通用时间约束.该文提出一种带有通用时间约束的序列模式挖掘方法,称为MSPU算法.该方法统一了目前有关时间约束的序列模式挖掘算法,能够发现更精确的序列模式.算法只需扫描一次数据库,通过采用分而治之的策略,将原始问题按照不同等价类分解为若干较小的、可独立解决的子问题.在各等价类内,为了克服由于序列加入最大间隙约束而带来的反单调问题,序列模式通过GS<,1>∨GS<,2>和F<,11>+S<,22>两种方法增长.模式增长过程细分为串连接、发现相同序列号和时间属性连接三步,为了提高挖掘速度,每步分别采用简单而有效的Apriori修剪、先行支持度修剪和后继支持度修剪删除非频繁序列.序列状态空间可以采取广度优先搜索、深度优先搜索和启发式搜索.其中,广度优先搜索能够充分使用各种修剪;深度优先搜索虽然不能充分使用Apriori修剪,但是有利于分布式处理,适用大型数据库的挖掘;启发式搜索能够使用各种修剪方法,更重要的是,在提前发现最大频繁序列的同时压缩了搜索空间.
其他文献
本文以自动化综合性先进控制实验系统建设为研究背景,提出基于PROFIBUS总线的控制方案,构建了先进控制实验系统,并实现了先进控制实验系统的网络化。围绕这个课题,重点深入研究了
本文基于DTS的算法解码标准[6],详细地论述了DTS的编解码原理,特别是对DTS的编码原理中的子带编码、全局比特分配、子带自适应差分PCM编码、声道耦合等进行了详细的阐述。在掌
现场总线技术是上世纪80年代末发展起来的一种新的工业控制底层网络,已经成为控制网络的典型实现模式.基金会现场总线(FF)是IEC61158现场总线标准中的一员,主要用于仪表行业.
文本以及基于内容二个不同的角度,对图像检索作了研究。另外多媒体内容描述标准MPEG-7也正在制定当中。基于文本的图像检索,其研究主要在数据库领域中进行,图像检索的一个典型框
多目标优化问题通常难以处理,80年代中期以来人工智能的进化算法开始应用于该问题,并形成了最近的一个热门研究领域.对多目标进化算法的研究也是近年来求解多目标优化问题的
该文在对现有人脸检测与跟踪方法进行详细综述的基础上,提出了基于曲线进化的人脸检测与跟踪方法,即以人脸轮廓作为描述人脸的主要特征,充分利用曲线进化方法可以建模和提取
连铸二冷区是指从连铸机结晶器出口到拉矫机的长度内设置的一个喷水冷却区.铸坯从结晶器出来后,内部还是液心,需要在二冷区继续冷却,使铸坯完全凝固,二次冷却的好坏直接影响
钢铁企业通常将不同热值的煤气混合以后加压再送往各生产单位。混合加压后煤气的热值与压力的稳定与否,是影响轧钢单位正常生产的最重要的因素之一。 煤气混合加压过程的控
在现代工业生产中,大量变流装置的应用,给电网注入了大量的无功功率和谐波,造成电能质量严重下降。为了保证电网和用电设备的正常运行,消除谐波污染变得尤为重要。三相电压型可逆变流器具有谐波含量低,可单位功率因数运行等优点,能够从源头上消除谐波,可用于解决电网谐波污染。首先,本文在三相静止abc坐标系和同步旋转dq坐标系下,分别建立了三相电压型可逆变流器的通用数学模型和dq模型,并提出了一种空间矢量脉宽调
说话人识别是模式识别的一种,它用语音信号和预先提取的说话人特征作为生物特征,确定或鉴别说话人的身份,符合当今信息化时代对身份验证的需求.人们已经认识到,语音信号中存