【摘 要】
:
空间RDF数据上的Top k最相关语义地点检索查询结合了基于关键词检索和基于地点检索的两种思想。这种查询会返回一组语义地点,每个语义地点都是以一个以带有关联位置信息的地点实体节点为根节点的子图。该查询通过计算一个评分函数来获取语义地点和关键词之间的相关度。这个分数由每个关键词在结果树上出现的节点和地点节点(根节点)的距离组合可得。但我们观察到由kSP(Top k Sematic Place)算法查
论文部分内容阅读
空间RDF数据上的Top k最相关语义地点检索查询结合了基于关键词检索和基于地点检索的两种思想。这种查询会返回一组语义地点,每个语义地点都是以一个以带有关联位置信息的地点实体节点为根节点的子图。该查询通过计算一个评分函数来获取语义地点和关键词之间的相关度。这个分数由每个关键词在结果树上出现的节点和地点节点(根节点)的距离组合可得。但我们观察到由kSP(Top k Sematic Place)算法查询返回的检索结果中,语义地点虽然在空间范围上和查询位置接近,但是和某些关键词的相关度却比较低。我们认为这是由于单个地点和查询词相关度较低造成的,如果可以同时返回多个相关的语义地点,或许有助于解决这个问题。因此,本文提出了语义地点检索的一个泛化版本,即语义区域检索。这种模型的查询输入参数为一个查询空间范围和一组查询关键词集合,旨在返回一个在空间上与查询位置比较接近,可以将评分函数最小化的有效语义区域,语义区域内的每个语义地点都和一个或多个查询关键词有着较高的相关度。评分函数考虑了区域内地点节点之间在RDF图上的接近程度,以及地点节点和查询关键词在图上的接近程度。和现有的语义地点检索相比,语义区域检索返回多个与关键词相关的地点,旨在解决单个地点无法满足用户需求的情况。为了更好更有效地支持语义区域查询的处理过程,本文提出了一种符合分支定界方式的算法SRRA(Sematic Region Retrieval Algorithm)。由于计算地点关键词相关路径,以及连接所有地点节点集合的子图的开销较大,SRRA算法使用了三种子集剪枝策略来处理语义区域查询。其中的一条剪枝策略通过保证一个语义区域中的地点节点的数目不能超过查询关键词的个数,从而减少需要计算的地点节点子集的数量。另外一个方法则是首先找到一个符合查询要求的候选语义区域,然后通过比较这个候选语义区域和其他语义区域分数的下界,来减少需要计算的地点节点子集的数量。在构建地点节点子集子树的过程中,算法继续使用由候选语义区域生成的界限来提前结束某些语义区域的计算。在这些剪枝策略基础上,本文还提出了两种优化技术来更加高效的处理语义区域查询。优化技术会利用已经计算好的地点节点集合中的地点节点来判断新的地点节点是否需要被加入,从而达到剪枝更多地点节点集合的目的。最后,为了评估被提出的语义区域查询处理算法SRRA和SRRA*(在SRRA算法基础上结合了优化技术的算法)的具体性能,本论文在不同参数设置下设计了多组对比实验,给出了两个算法在两份真实知识图谱数据集上的实验评估结果并进行了分析。实验结果表明优化以后的语义区域查询处理算法SRRA*在性能上有着优异的表现,并且查询结果与查询词有着很高的相关度。
其他文献
近年来,量子流体力学成为应用数学界的研究热点之一.在物理学中,量子流体力学被广泛应用于各个领域,如核的流体模型和超导体的流体模型等.而在数学上,量子流体力学模型是一个耦合双曲、椭圆与非线性色散关系而形成的复杂系统,是经典模型的色散过程[57].本文研究的是可压缩量子磁流体模型,当磁场为零时,该模型将变成可压缩量子Navier-Stokes模型.当普朗克常数等于零时,量子效应消失,该模型将变为可压缩
低频、可靠的预测买入或卖出的关键交易事件,是实现金融交易高回报、低风险的有效途径。金融序列的过去值对未来值有直接或者间接的影响,这导致了关键交易事件具有上下文依赖性,交易关键点在相对应的上下文子序列中才有意义。本文首先从价格相对强弱指数RSI和交易量相对强弱指数RSI中提取不同特征组成辅助序列R。根据辅助序列R,定义了圆弧底形态RB和圆弧顶形态RT上下文子序列和其中的关键交易点,并设计相应分割算法
硒是一种生命必须的微量元素,与多种生理过程及重大疾病有关。硒蛋白是硒在体内的主要作用形式。使用生物信息学方法对硒蛋白及其相关合成基因进行识别是硒蛋白研究的一个重要方向。近年来,伴随着生物信息学的快速发展以及大规模物种基因组测序的完成,硒蛋白的研究工作取得了重大进展。但人们对于真核生物硒蛋白的认识还非常片面,仅仅局限于某些特定分区中。而且对硒蛋白的功能和合成机制的认识还不清晰。本论文首先建立了硒蛋白
21世纪以来,随着通信技术和信息产业的持续高速发展,各种通信方式不断出现并迅速得到广泛的应用,数字信息的存储和交换量与日俱增,也使人们生活的各个方面都变得十分便利.我们知道数字信号在无线或有线发射的过程中,有时会受到外界的干扰,因此在接收端往往会产生误码.纠错编码即信道编码是现代编码理论之一,主要为了研究如何克服外界的干扰,提高信息传播的准确性,改善通信的质量,使通信系统具有自动检错和纠错的能力.
流感作为一种具有季节性和高度传染性严重危害人类社会安全的大型流行性疾病,对于流感特别是禽流感的防控显得非常重要。禽流感病毒作为一种导致人患高致病性禽流感的病原体,侵染人体后会产生于普通流感相似的发热、腹泻、肌肉酸痛等症状。与通常的人流感病毒导致的季节性流感不同,禽流感病毒在经过基因重组后获得跨物种侵染能力,且人体对此类病毒亚型没有初步免疫能力,因此当人体初次接触到禽流感病毒后,会引发比普通流感更严
随着人们生活水平日益提高,生理机能健康越来越受到大众的关注,生理功能下降已被认为是引发人体各种疾病的主要诱因。如果不采取适当和必要的措施,生理机能下降将导致更多的并发症。生理机能评估是对人体各部分机体能力做出科学合理的评价,是预防生理机能病变、保障人体健康的重要步骤。目前生理机能的评估需要在专业人员的全力配合下进行,这样带来大量人力时间成本。针对此类问题,本文观察到将基于深度信息的人体活动分析与评
溴酸盐是含溴化物的水在进行臭氧消毒过程中形成的副产物,国际癌症研究机构(IARC)将其列为潜在的致癌物。溴酸盐的去除方法包括物理法、化学法和生物法。其中生物法通过微生物自身代谢作用在以有机物等作为电子供体条件下将溴酸盐还原为无毒的溴离子。该方法具有低能耗、无二次污染等优点,应用前景广阔。然而,在微生物还原溴酸盐的研究中,溴酸盐还原功能菌群的多样性尚不明确,溴酸盐还原功能基因和代谢机理尚未明晰,溴酸
目前全球大约有2.85亿视力障碍人士,他们因失去视觉这一重要信息源而渐渐被社会边缘化。通过将视觉图像处理技术应用到盲人辅助系统中帮助他们更好地从周围环境获取信息,具有较大的工程意义和社会意义。随着深度学习的发展,以卷积神经网络为基础的目标检测算法开始应用到盲人视觉辅助系统中,其在识别率和鲁棒性上都优于传统图像处理技术。然而,因为卷积神经网络运算中包含大量乘加计算与频繁的数据读写,导致算法移植到资源
蛋白的氧化还原是普遍存在于生物体内的一种化学反应,可由物理、化学和生物因素诱导产生。生理水平的活性氧簇(Reactive oxygen species,ROS)对细胞增殖和生长有积极的调节作用,但如果超过某一阈值,将会严重损害DNA、蛋白质、脂质等生物大分子,造成细胞功能丧失甚至不可逆损伤。含硫氨基酸甲硫氨酸(Methionine,Met)是最易被氧化的氨基酸之一,氧化后的甲硫氨酸形成两种差向异构
既有研究表明保障性住区存在特定人群特征与居住需求,其户外公共空间存在供给与需求不匹配的问题,包括户外空间景观化、功能与设施配给不足、人均活动场地面积偏小等问题。这些问题一定程度上影响了居民的居民生活质量和居住满意度。本研究以保障性住区内的户外公共空间为研究对象,聚焦于居民时空间行为与户外空间关系,围绕着如何提升保障性住区户外空间供给与需求的问题展开。研究在对深圳保障性住房项目进行普查式调研的基础上