空间文本数据发布/订阅研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:sangsang126
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的高速发展与移动智能设备的普及,各种社交软件中产生了大量的空间文本数据。空间文本数据具有空间属性与文本属性,如何分析大规模的空间文本数据,从中获取最大的经济效益,成为了人们的关注热点。发布/订阅作为处理空间文本数据有效的方式之一,受到了学术界与工业界的关注。然而,现存的发布/订阅无法实现订阅与消息的高效匹配,不具备良好的表达能力。本文针对空间文本数据发布/订阅进行了研究,做了两方面的探索,以使得发布/订阅适应于大规模订阅环境中。第一,研究了布尔表达式发布/订阅。针对布尔表达式发布/订阅设计了高效的本地索引结构TR-tree与匹配算法。TR-tree包括文本索引与空间索引,存储在主要用于执行订阅与消息匹配的匹配节点。文本索引根据谓词数量与关键属性对订阅分组。为了减少重复存储谓词值对的次数,文本索引还使用了操作符列表。空间索引根据谓词数量与关键属性构建R-tree,以达到修剪空间的目的。实验对比结果展现了 TR-tree索引结构的高效性。第二,研究了分布式发布/订阅。针对分布式发布/订阅提出了空间文本数据划分方法,设计了全局索引结构Gindex与框架DSTSP。鉴于查询的偏斜性导致系统负载不均衡,提出了负载均衡策略。全局索引Gindex存储在分布式系统中的分派节点中,根据空间属性与文本属性实现空间文本数据的划分。DSTSP由分派节点、匹配节点与结果整合节点组成。其中,分派节点主要负责将消息或者订阅分发到相应的匹配节点;匹配节点负责订阅与消息的匹配;结果整合节点负责整合匹配结果以得到最终结果,并将消息发送给订阅者。此外,分派节点还能根据收集到的信息,判断系统的负载。如果匹配节点超载,则使用成本模型计算分区划分成本,然后执行分区再划分。
其他文献
目前,现代社会已经进入继农业经济、工业经济和服务经济后的体验经济时期。体验经济以满足消费者需求和体验为导向,催生了新的消费文化和观念进而影响消费者行为。媒介消费是
目的探讨低重氢水对D-半乳糖(D-gal)所致衰老小鼠脑组织氧自由基损伤的影响。方法成年ICR小鼠随机分为正常对照组,衰老模型组和低重氢水组(n=10),低重氢水组小鼠给予低重氢水自由
对反应堆厂房手动单轨起重机进行抗震分析,利用ANSYS有限元软件将厂房主体结构与运行机构和装载葫芦进行有效结合,对核电设备进行整体抗震分析。采用结构静力计算、模态分析
现有社区发现算法大多仅考虑图的拓扑结构或节点的属性信息,其中结合两者的属性图聚类算法挖掘效果不理想,而基于共享邻居的局部相似性算法却未充分度量节点间相似度。针对上
大学生思想政治教育工作要着眼以人为本并促进人的全面发展,把以人为器的科学发展观融入到大学生思想政治教育的各个方面中去,使大学生思想政治教育工作真正体现以人为本的价值
普通高考语文广东卷“设置”现代文阅读“选考”而同时设计“实用类阅读”试题,是自2007年开始实施“新课程高考”出现的新的高考语文阅读考查方式。据说这是为了落实关于尊重学生“阅读”的自主性、尊重学生阅读“个性”的新课程思想而做出的重大改革措施。我们不能否认这一措施当年对在中学语文教学中引导学生“自主阅读”所具有的重要的导向和启迪意义。但从已经过去的“七年”高考“选考”实践来看,灰色的理论已经被“长青
2013年高考渐渐远去,2014年高考的烽火已经点燃.俗活说,知彼知己,百战不殆.平面向量作为数学高考的必考内容.它在高考中主要涉及哪些考点?让我们从2013年高考真题中看分明.
前言:在目前图书馆发展过程中,要想使图书馆的作用得到充分发挥,就要对图书管理的作用和意义有全面正确的认识,应从图书管理实际出发,认识到图书管理对图书馆发展的重要性,并从理念