基于自适应结构概要的有向标前图子图查询匹配算法研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:mimistart
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
有向标签图作为重要的数据表示模型,广泛应用于社交网络、生物信息学、语义 web等信息技术相关的研究领域。目前,随着上述领域数据规模的快速增长,如何高效管理较大规模的有向标签图数据,成为了数据管理领域的热点研究问题,其中,子图查询匹配问题,由于其应用的广泛性而备受关注。如何高效地在较大规模有向标签图数据上进行子图的查询匹配,成为本文的主要研究目标。  本文分析并总结了有向标签图子图模糊查询匹配技术在国内外的研究现状,并在此基础上,以图压缩的思想作为基础,对较大规模有向标签图上的子图查询匹配技术进行深入研究,主要工作包括:  首先,提出了一种能够随查询图动态自适应更新的有向标签图结构概要模型——自适应结构概要ASSG(AdaptiveStructuralSummary ofGraphdata)。本文基于图压缩的思想构建有向标签图的自适应结构概要。该结构概要可随着查询图的引入而进行自适应更新,以应对不同查询图的查询匹配。另外,结构概要模型对于有向标签图中从未涉及查询的部分保持高度压缩,极大降低了存储空间。  其次,基于自适应结构概要,提出较大规模有向标签图上的子图查询匹配算法。本文通过结构概要模型定位候选匹配顶点集,并在引入查询图时更新结构概要模型的结构,最后通过子图查询匹配算法,可在接近线性的时间复杂度内,实现对查询图的查询匹配。  最后,本文在真实数据集 California、Citation、Internet及半模拟数据集Synthetic上进行了大量的对比实验,对主要工作进行了验证。实验结果表明本文提出的自适应结构概要 ASSG能够在线性时间复杂度内构建,并在接近线性的时间复杂度内更新。基于 ASSG的子图查询匹配算法的时间复杂度亦接近线性,较现有的其他子图查询匹配算法而言,显著降低了时间及空间复杂度。
其他文献
目前,手机短信息已成为继Internet之后的“第五媒体”,成为人们日常交流的主要方式之一。短信息在给人们带来极大方便的同时,也产生了一定的负面影响。恶意使用者利用短信平
物联网时代的到来被称为世界信息产业发展的第三次浪潮。“智慧地球”战略的提出以期通过覆盖海量的智能传感器,在物物相联的概念下一切物体都可以被感知,让整个地球形成可被感
目前关于数据挖掘的研究很多,主要是对挖掘算法的研究,而对挖掘过程管理的研究则相对较少,而数据挖掘过程又是需要多次反复的多阶段处理过程,为了有效地管理和控制数据挖掘各个阶
伴随着计算机、网络通信等技术的迅猛发展,数字媒体技术也取得了长足进步,同时给人们的生活方式和经济发展模式带来了重大变革。几乎每时每刻都有大量的数字媒体产品通过网络进
手语是一种动作语言,通过一连串手势的运动并附以适当的面部表情或身体躯干姿势来表达语意,是聋哑人的第一自然语言。目前中国标准手语的推广程度不高,内部仍存在着地域差异
随着网络数据、生产数据等持续增加,形成大量的数据,这些数据给存储和查询带来严峻的挑战。但可凭借数据划分方法将海量数据分块分布存储在多个机器中,这样既能能解决单机器的存
无线网络能被用于经济、军事、娱乐以及健康相关的许多应用领域,这些应用常常包括敏感信息的监测,例如战场上敌人的移动或者建筑物里人们的位置。因此,在无线网络里,安全是非常重
随着移动互联网技术的发展与移动终端的普及,社会生活的信息化日益深入,人们越来越依赖于手机、平板电脑等智能移动设备。笔记类软件是传统纸笔记录行为在科技进步的环境下衍生
Web信息量的急剧猛增以及广大互联网搜索用户信息检索需求的不断提升,使得搜索引擎技术由原来的面向全体互联网用户,提供公用信息服务的通用搜索引擎发展到面向特定领域,为用
近些年来,由于互联网技术的迅猛发展以及通信网络带宽和处理能力的大幅提高,使得网络能够提供形式多样的多媒体业务,同时也使得支持“点对多点”或“多点对多点”的组播通信方式