图数据中属性差异紧密子图查询

来源 :沈阳建筑大学 | 被引量 : 0次 | 上传用户:dingsiwei2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,图数据挖掘技术已经成为了一个备受关注的研究领域,由于现实世界中很多事物都能够自然地使用图模型来描述,该技术广泛地应用于社会网络、计算机网络、计算生物学、web应用等领域。紧密子图是具有特殊结构与性质的子图,因紧密子图的诸多性质,紧密子图能够帮助理解各种类型关系网络的结构特征。因此,紧密子图成为图数据挖掘领域的重要研究方向。   随着信息技术的飞速发展,越来越多的真实网络出现在人们视野中。在具有极大规模的同时,种类纷繁的内容信息也出现在这些网络中。传统的紧密子图发现问题主要基于图的拓扑结构特征而忽略了图上的内容信息,而利用这些极具价值的内容信息对传统的紧密子图发现问题进行扩展将能够产生更多新的有意义的应用。   本文提出一种新的结合图的结构特征和节点内容属性的紧密子图发现问题—top-k属性差异q-clique查询,找出图中节点间属性具有较大差异的q-clique。该问题旨在使所找出的紧密子图中属性内容尽可能丰富且节点的属性内容各有特点。给定q-clique的属性差异度量,发现k个具有最大差异的q-clique称为top-k属性差异q-clique查询。在科研合作关系图中,该查询可以发现诸如研究领域或所属单位等属性上不同的具有紧密合作关系的团队,这类团队可能具有更强的综合竞争力。在股票市场图中,该查询可以发现彼此价格具有紧密相关性而来自于不同行业的股票组合。   本文给出了三种q-clique的属性差异度量,通过将节点间的属性相异度转换为邻接边的边权值,使得问题转化为最大权值q-clique查询问题,同时本文证明了该查询问题为NP难问题。本文采用回溯法,利用图的结构性质和边的权值形成剪枝条件,提出了一种有效求解问题的算法AD-Qclique,同时依照best-first排序思想优化节点访问次序,提出基于优先次序的AD-Qclique算法进一步提高算法性能。   本文采用真实的ACM学者信息数据集进行实验,分析了查询算法的效率和查询结果的质量。实验表明,本文所提出的算法AD-Qclique效率远优于基本算法BSL,而基于优先次序的AD-Qclique算法也有效地改善了算法的性能。最后,本文对查询结果q-clique中的节点的结构中心性及结果q-clique的各类多样性指数进行了分析,并比较了各属性差异性度量的优劣。实验表明,带层次简单节点属性相异度极好地满足了本文所提出查询问题的应用需求,较高属性差异度的查询结果中的学者节点皆具有较强的结构中心性、较高的H-index值及广泛的研究领域。同时,结果q-clique都具有较高的多样性指数值,表明查询返回的合作团队具有较强的综合竞争力。总之,作为一种特征紧密子图查询,属性差异紧密子图查询问题具有重要的实际应用价值,能够进一步地挖掘网络中有意义的特征子结构。
其他文献
随着面向服务架构的发展与广泛应用,作为其重要实现的Web服务受到工业界与学术界的重点关注。Web服务组合作为面向服务架构的关键技术,一直是Web服务领域的研究重点与热点,然
随着电子地图等领域的飞速发展,地理信息和空间数据在人类生活中发挥的作用越来越大,空间数据在油田的信息化建设中的作用也越来越大,但是针对油田空间数据多分辨率特征的研究却
人类主要通过语言和图像这两种形式来传送相关信息。其中,通过图像所获得的视觉信息又占人类获得的各种信息中的80%,因此图像信息在信息传递媒体和方式中占据了重要的地位。图
随着科学计算的精细化,计算量日益增大,计算相关领域越来越重视并行计算的研究以获得更高的计算速度。随着多核处理器系统和GPU通用计算的广泛应用,当前并行计算领域存在着多
近年来,多投影显示技术日益成熟,在商业上的应用越来越多。然而,目前市场上的商用多投影显示系统软件有限,多投影显示系统的市场远未饱和。本文介绍了一种多投影显示系统的实
这些年,伴随着各种智能移动设备的出现,移动数据库技术得到了一定的发展与应用,但是同时也出现了很多的问题,例如移动复制过程中的数据如何保持一致以至于不发生冲突,解决这
随着无线通信网络的迅速发展,人们对其网络信息传输可靠性方面的要求也越发提高,特别是差错控制技术,是移动通信可靠性需求保证的关键,其在日益强调通信信息传输准确性、可靠
随着旅游行业在全球范围内的快速发展,人们越来越倾向于通过有效的搜索引擎寻找发现有趣的地方以及收集相关的信息。随着Web2.0的迅猛发展,越来越多的人会在一些旅游社区网站
基于双目视觉的实时三维重建是以双目相机拍摄的图像为数据输入,通过视觉算法恢复出三维模型的逆向工程。双目立体视觉系统设备价格低廉,重建速度快且精度高,因此在无人机电
数据可靠性作为备份系统中最重要的指标之一。传统的C/S架构中,主要通过备份数据的冗余存储保障高可靠性。在引入P2P网络的混合架构中,数据分布在P2P网络和中心存储服务器中,对