多源点空间文本Top查询算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:f11034
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动定位技术的发展以及便携式设备的普及,基于位置的地理信息服务(Location-Based Services)变得越来越受欢迎,空间文本查询能同时兼顾用户的位置信息和文本描述,相比于传统的空间查询更能满足用户的需要。典型的应用场景就是用户使用手机,在某个地理引擎中,提出自己的查询请求(用户当前的位置信息和文本描述信息),系统会查询到距离用户较近并且文本描述尽可能相似的k个空间文本对象。在这个问题上,已有大量的研究工作,但都主要针对于单个查询点(单源点)的空间文本Top-k查询问题(SSLkT),不能处理多个查询点的查询情形。基于上述问题,本文提出多源点空间文本Top-k查询(MSLkT),能够综合考虑多个查询点的空间位置信息和文本描述信息,从而给出总体最优的k个空间文本对象。本文的研究核心,主要是围绕着不同的空间距离度量(欧氏距离,道路网距离)来展开工作。  在欧式空间上,首先提出了阈值算法(TA),该算法先对每个查询点执行普通的空间文本Top-k查询,然后把每个查询点的结果合并,根据总体相似分值选出相似度最高的k个空间文本对象。然后,针对阈值算法会重复遍历索引结构的缺点,提出了更高效的MBR算法(MBRA)。该算法把所有的查询点视作一个的整体,统一执行空间关键字查询,同时利用最佳优先遍历思想(BF),进行高效的查询剪枝,减少对索引结构的访问。在道路网上,为了加快对道路网节点的访问速度,本文首先介绍道路网的组织与存储结构,然后介绍了道路网上针对单查询点的算法SSTopK,该算法基于Dijkstra的查询思想,由近及远一步步寻找距离查询点最近的空间文本对象,接着基于该算法提出了针对多查询点的MSTopK算法并对其进行了优化。最后,在两个不同的数据集上对本文所提出的算法进行实验评估,验证了本文所提出的算法的有效性。
其他文献
聚类是数据挖掘的主要技术之一,也是学术界研究的热点问题,并在各个领域的数据分析中起到重要作用。聚类边界的识别有助于提高聚类结果的准确性和揭示聚类所具有的特性,对它
信息技术的发展使数据得到了爆炸性的增长,这些来自互联网及生活中的数据往往存在着紧密的关联性,图作为一种广泛应用的数据结构,非常适合用来描述这些具有紧密关联性的数据,这些
随着计算机技术的不断发展,计算机软硬件系统已经深入渗透到实际生活中的各个领域,若这些系统一旦出错,将给人类带来不可承受的损失,所以,安全问题已经逐渐成为人们的重点关
近年来,中国奶牛养殖业快速发展,黑龙江省的奶牛养殖业已经具有很大的规模,且呈逐年上升趋势。多数奶牛场尚缺乏有效的监测管理机制,当奶牛在养殖场饲养过程中,出现生理异常或走失
车辆图像检索是智能交通系统的重要组成部分,车辆检索在高速公路服务区、停车场等场所以及在停车场智能管理、高速公路自动收费、道路监控、超时停车检测等方面有着非常好的应
  随着互联网的普及应用,互联网已经成为影响人们工作和生活的一种新媒介。越来越多的人们更愿意通过互联网提供的各种平台表达个人情感、表达自己对国际形势、政府政策以及
随着信息化的高速发展和客观上硬件技术的有效支撑,使得数据集中的海量数据不免存在冗余、缺失、不确定数据和不一致数据等诸多情况,这些统称为“脏数据”。人们需要从数据集中
伴随着人们生活节奏的加快和物质水平的提高,由饮食不合理所引发的身体健康问题日趋严重,最具代表性的为高血压和心脑血管疾病。这些疾病多数是由于营养物质过剩,导致钙磷产
无线传感器网络的一个核心问题是拓扑结构的构建。近年来,基于连通支配集及其变型的虚拟骨干网络结构受到广泛的研究,它们对改善网络路由性能,延长网络生存时间具有重要意义,并能
随着科技的进步,智能视频监控正日益发挥着越来越重要的作用。如今大规模的视频监控系统被广泛应用于各类公共场所,如何对这些海量的监控视频数据进行分析处理进而提取出有用