空间-文本数据的语义典型化查询与多样性推荐方法研究

来源 :辽宁工程技术大学 | 被引量 : 0次 | 上传用户:tongjm2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动网络的普遍应用和GPS技术的快速发展,大量包含位置信息和文本信息的空间Web对象(简称空间对象,如兴趣点、用户签到记录等)逐渐形成了规模庞大的空间-文本数据,以空间-文本数据为背景的两种高度相关的空间关键字查询和兴趣点推荐技术正成为当前基于位置的服务(Location-based Service,LBS)领域备受关注的研究热点。本文针对当前空间-文本数据的查询与推荐领域中亟待解决的空间关键字语义近似查询、查询结果典型化分析和多样性兴趣点推荐等问题进行研究,取得了如下创新研究成果。(1)现有的空间关键字查询处理模式大都仅支持位置相近和文本相似匹配,但不能将语义相关但形式上不匹配的空间对象提供给用户;并且,当前的空间-文本索引结构也不能对空间对象中的数值属性进行处理。为了解决上述问题,提出了一种支持语义近似查询的空间关键字查询方法。首先,设计了一种基于条件生成对抗网络(Conditional Generative Adversarial Network,CGAN)的查询关键字语义扩展模型,用来生成语义相关关键字;然后,构建了一种能够同时支持位置和文本匹配并利用Skyline方法对数值属性进行处理的多维混合索引结构(Attribute Inverted-file R-Tree,AIR-Tree),给出了 AIR-Tree 的插入、删除和查询操作的实现算法;最后,利用AIR-Tree对扩展查询条件进行查询匹配,并根据综合评分函数对匹配结果进行top-k排序。实验结果表明,基于CGAN的查询扩展模型产生的语义相关关键字更为合理,并且对罕见查询关键字也能够进行有效的语义扩展;构建的AIR-Tree索引能够有效解决数值属性查询问题,并且具有较高的查询准确性、较低的索引构建时间和较快的执行效率。(2)根据位置相近度和文本相似度评分方式返回的top-k个结果之间通常比较相似,而用户希望系统能从匹配结果中选出少数典型对象从而增强其对查询结果集合主要特征的理解。为了解决上述查询结果典型化分析与典型对象选取问题,提出了典型程度评估和top-k近似选取方法。首先,计算所有空间对象之间在位置、文本语义和数值属性等维度上的综合距离;对于空间对象的描述文本和评论文本语义相似度评估,分别提出了基于关键字耦合关系和基于词嵌入与卷积神经网络相结合的语义相似度评估方法。然后,根据空间对象之间的综合距离,提出了基于高斯核函数概率密度估计的空间对象典型程度评估方法。为了提高大规模数据集下的查询结果典型化分析和top-k典型对象选取的执行效率,分别给出了基于淘汰策略和基于局部邻域的top-k近似选取算法,并且证明了基于局部邻域近似选取算法的误差率理论上界。实验结果表明,提出的空间对象文本语义相似度评估方法具有较高的准确性和合理性,基于局部邻域的top-k近似选取算法具有较小的误差率和较高的执行效率。(3)当用户获得查询结果后,还希望系统能够自动为其推荐查询结果区域内他可能感兴趣的其他类型空间对象。为了解决该问题,提出了一种综合考虑空间对象之间位置关系和社会关系的多样性与个性化兴趣点推荐方法。首先,构建了空间对象之间的位置-社会关系模型,评估空间对象之间的位置-社会关系相关度;然后,提出了基于谱聚类的空间对象聚类划分方法;最后,利用概率因子模型从各聚类中选取用户偏好的兴趣点构成多样性和个性化的兴趣点推荐列表。实验结果表明,基于位置-社会关系相关度的聚类方法具有更为合理的聚类效果,推荐的兴趣点列表具有较高的多样性和一定的准确性,拓展了用户对查询结果区域内其他兴趣点的了解并增强了用户对这些兴趣点之间位置-社会关系的认知。上述研究成果可应用于空间-文本数据的查询与推荐、典型化分析、基于位置的服务系统、隐形社区发现、时空数据挖掘、城市计算、市场营销等应用领域,对于改进各领域现有系统的服务质量具有重要作用。该论文有图50幅,表41个,参考文献138篇。
其他文献
学位
炼焦煤兼具燃料与原料双重属性,是一种稀缺、不可再生且短期内无法替代的战略资源。山西省是全国最大的炼焦煤生产基地,深部煤层硫分高,特别是有机硫含量高。硫含量是影响煤自燃的重要内因,随着煤炭开采深度向下延伸,高硫炼焦煤面临自燃危害的巨大挑战。炼焦煤自燃兼具煤矿安全、环境污染、稀缺煤资源损失三大危害。因此,研究其自燃特性及机理具有重要意义。本文依据结构-反应-机理的基本思路,综合氧化反应实验与反应分子动
空间碎片是人类空间活动的产物,随着人类航天活动次数的增加以及空间碎片之间的碰撞解体,空间碎片的数量会进一步增加,空间碎片与在轨航天器的碰撞概率也会持续增长。为保障载人飞船、太空站以及各类卫星的安全运行,对空间碎片进行高精度的跟踪监测势在必行。激光测距技术作为目前空间目标跟踪探测技术中精度最高的一种空间技术,已被世界各国用于空间碎片的探测,其探测原理与卫星等合作目标的探测原理基本相同,但是在实际观测
数字化、智能化是矿井通风工程安全、高效发展的方向,通风参数自动获取、监测数据预处理与网络解算等是实现这一目标的核心技术支撑。矿井通风智能化建设尚处初级阶段,平台建设认知不足、监测传感器选址不科学、监测数据降噪方法不明确、体积流量假设对深井(或热害矿井)风网解算不理想等问题从根本上制约了通风智能化的发展。基于此,论文采用归纳演绎、数值模拟、统计分析等方法对矿井智能通风系统架构和实时网络解算关键技术进
学位
我国北方大部分路基施工的施工都是在季节性冻土或者长期冻土层上展开的,冻土在冬季负温条件下内部的孔隙水会变成固态冰,进而使得冻土具有类“岩石”的力学特性;同时,冻土内部存在的固态冰、液态水和气体互相混合,使得冻土变形和岩石变形在本质上有很大的区别,以及冻土在外荷载作用下的流变性质也比岩石的明显。这些复杂内因以及温度、应力等外界因素导致了工程竣工后,路基上部道路、构筑物发生失稳破坏、路面鼓包开裂等现象
一般认为无烟煤不易自燃,而阳泉矿区的高变质无烟煤层开采过程中时常遇到煤中非均质赋存的伴生硫铁矿物,导致煤自然发火,严重威胁着煤矿安全开采。论文以阳泉矿区4个典型工作面的煤作为研究对象,采用理论分析和物理模拟实验相结合的研究方法,研究了煤中内在黄铁矿、伴生硫铁矿物及其氧化产物对煤自燃的影响规律,揭示了伴生硫铁矿物诱发无烟煤自燃的机理。主要研究成果如下:实验研究得出,煤与伴生硫铁矿物中硫的赋存形态均以
学位
目前,湿式治理方法存在对呼吸性粉尘捕集效率低、能耗成本高、喷头易堵塞、现场适用性差等问题,而气液两相雾化降尘是一种不易堵塞、成本低廉的强动力方式,但目前国内外此类技术及理论对呼吸性粉尘的治理缺乏针对性。尤其,涉及低气、水压力下的超音速气动雾化相关理论研究较少,细观动力学特性及捕尘机理还未明确,相关基础理论和研究手段有待进一步丰富和发展。基于此,本文提出对超音速汲水式气动雾化细观动力学特性及捕尘机理
随着全球性的能源危机和环境污染问题的日益严峻,新型可持续能源日益成为工农业生产的主体能源,其中光伏发电由于无噪声、无污染排放、清洁等优点近年来发展迅速,逐渐成为未来重要电力来源之一。虽然光伏发电系统运行的关键技术日渐成熟,但伴随光伏发电系统而来的电气安全和效率问题却严重制约着其广泛发展与应用;如何提高光伏发电系统的效率,抑制和降低电压和电流冲击对设备与系统的损害、预防火灾等问题,日渐成为国内外光伏