图上的关键字搜索算法

来源 :复旦大学 | 被引量 : 0次 | 上传用户:viggb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近十年来,关键字搜索技术一直是数据库、信息检索和数据挖掘领域的研究热点。而当前,图上的关键字搜索由于具有更加广泛的适用性而备受关注。图上的关键字搜索算法与传统的关键字搜索算法不同,查询处理返回的查询结果是图上的子图,每一个查询结果子图包含所有的查询关键字。现有的图上关键字搜索算法基于最小斯坦纳树,使用反向搜索和正向搜索结合的方法来得到符合查询关键字的子图。然而这类算法具有三个不足,使得查询结果缺乏语义信息:一,在搜索时未考虑节点与查询关键字的匹配程度;二,在搜索是未考虑图结构中隐含的结构信息;三,树结构的子图不能表现出足够的语义信息。本文提出了两个新的图上关键字搜索算法,使用了现代信息检索技术中的向量空间模型和随机游走模型来解决以上缺陷,使得查询结果更具语义信息。基于重启型随机游走的图上关键字搜索算法,在重启型随机游走模型的基础上加入了向量空间模型。该算法首先搜索得到与所有查询关键字相关的中心节点,再通过中心节点搜索连接成子图。而基于概率模型的图上关键字搜索算法,设计了一个综合了向量空间模型和重启型随机游走模型的概率打分函数。该算法首先搜索得到与查询关键字匹配的关键字节点,再由这些关键字节点的中心节点将它们连接成子图。实验结果证明,本文提出的算法是有效的。
其他文献
雾计算是在传感网络和数据中心之间的边缘服务器上构建的服务和应用,它将传感网络和数据中心的部分功能迁移过来,并提供有限的分布式计算、存储和网络服务。雾计算作为物联网
在网络环境下数据传输发挥着巨大优越性同时也对软件体系结构和开发方法带来了新的挑战。一方面,通信软件的开发越来越复杂、维护和移植越来成本越高;另一方面,软件的应用需求
随着网络建设规模的不断增大,各行各业对其网络可靠性的要求也在不断的提高。网络可靠性作为网络建设的一项重要指标,时刻影响着其布局与规划。如何快速、精确地计算网络可靠
远程监控工业设备,不仅可以实现对现场运行数据的实时采集,获得现场监控数据,进行远程故障诊断技术,而且可以使技术人员无须亲临现场,特别是环境很恶劣的情况就可以监视并控
位置管理是对移动终端的位置进行管理,在一个寻呼到达时,网络能够快速准确的定位移动终端的位置,成功建立呼叫链路,同时使网络资源得到有效利用。随着无线网络技术的发展,移动用户
计算机取证系统包括证据搜索和证据分析两部分。证据搜索主要是完成对已有证据的信息定位、搜集。证据分析主要是对证据搜索部分得到的搜索结果进行全方位的整理、分析、研究
随着网络以及多媒体技术的不断发展,多媒体业务逐渐在Internet应用中占据主导地位。与之相适应,多媒体终端发展十分迅速,其形式也由依赖硬件提供主要功能的硬终端扩展到基于软件
随着半导体制造工艺和大规模集成电路设计能力的发展,嵌入式设备体积越来越小,功能却越来越强大,由此导致系统能耗问题日益突出。研究表明,存储子系统的能耗是整个片上系统能
随着Internet的飞速发展,分布式系统得到了广泛应用,为信息的存储、传递、发布及获取方式带来了重大变革,同时也为数据完整性、非授权访问等安全问题带来了新的威胁。访问控
近年来,根据人类自身的生理特征尤其是人脸特征进行自动检测和识别研究已成为人工智能和计算机图像处理领域的热门研究课题之一。其中,人脸特征研究的重点在于眼睛、嘴巴的检