序列概念格模型及其序列模式挖掘

来源 :扬州大学 | 被引量 : 0次 | 上传用户:lzj60
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的日新月异使得各个领域的数据量激增,在此背景下诞生的知识发现和数据挖掘给人们提供了一种新的认识数据、理解数据的智能手段。序列模式发现是其中的一个重要研究课题,概念格是一种擅长描述层次关系的有效工具,因此,研究概念格的基本理论以及将其应用于知识发现有着非常重要的意义。以概念格为工具来实现序列模式发现是当前数据挖掘领域的一个新的研究热点。本文对基于概念格的序列模式发现的方法展开研究。本文主要就此领域的相关问题展开系列研究,主要工作和创新点如下:详细讨论了序列模式的基本模型以及经典的发现方法,展现了序列模式发现研究领域的应用前景及所面临的挑战。综述了概念格的基本理论以及经典建格算法,并讨论了以概念格模型为核心来组织数据结构和算法以实现序列模式挖掘的基本方法和策略。提出了两种新的概念格的扩展模型,一种是以序列数据库中频繁项集为节点的基于兴趣度的序列概念格模型,并引入了序列的兴趣度,以方便在此基础上挖掘出用户感兴趣的序列模式。另一种是序列模糊概念格模型,它是把精确的序列数据库背景转化为模糊的序列形式背景,并定义了模糊序列概念的Galois闭包连接、序列模糊概念及序列模糊格结构,最后给出了序列模糊概念格的渐进式构造算法。由于传统的序列模式发现算法需要多次扫描数据库,因而时间开销较大,并且所挖掘出的所有的频繁序列整个过程缺乏针对性,时间代价高,结果数量巨大且难以理解。为解决此类问题我们提出两种基于概念格的序列模式发现算法,一种是基于兴趣度的序列概念格的最大序列模式挖掘,一种是基于序列模糊概念格的序列模式挖掘。通过实验表明,在序列概念格模型上可以方便有效地挖掘重要的序列模式,算法在时间与空间上都具有良好的性能。
其他文献
超立方体互连网络具有正规性、对称性、强容错性、直径短、可嵌入性等优点,是人们最早研究且仍是目前最重要的互连网络拓扑结构之一。高性能计算机系统规模的不断扩大,导致网
随着道路客运企业信息化的不断深入和扩大,多套IT系统同时运行在较为分散的各个受理站点上,然而,IT维护人员数量不足,不能满足道路客运企业正常需求,导致IT服务性能严重制约
在MOSS 2007中,只有位于同一个业务应用程序中的实体之间才能进行关联。业务数据目录可以集成来自后端服务器的多种业务应用程序,位于不同的业务应用程序的实体之间称为异源
计算机支持的协同设计(CSCD)已成为当前信息技术领域的研究热点。针对产品协同开发中的数据异构性、需求多样性和过程反复性等特点,本文深入研究了产品协同设计系统中的图形