基于语义的Linked Data大数据关键字检索研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:xiehao2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,由于各领域都在持续不断地发布数据,链式数据(Linked Data)的规模愈来愈大,内容愈来愈丰富。如何方便高效地利用语义Web上的数据越来越被人重视,越来越多的研究涉足这一领域。由于传统的信息检索(IR)技术已经不再适用于链式数据上的检索,普通用户很难在链式数据上准确高效地检索自己想要的数据,所以亟需一种新的检索方法来访问链式数据。本文提出了一种在链式数据上做语义关键字检索的方法。考虑到系统的可扩展性,基于MapReduce计算框架和Bigtable数据模型提出了两种分布式的倒排索引方案,其中一种是根据链式数据建立的,而另一种是根据本体建立的。而且作为建立本体索引的一个必要组成部分,一种本体编码方案也同时被提出了。基于这些索引方案,又根据BM25F排序模型设计了一个改进的排序算法OntRank。通过分析查询语句得到用户的查询意图,并用一个语义影响因子来表示此查询意图,接着向BM25F排序模型中加入这个语义影响因子,来提高最终排序的结果。本文设计的实验从索引构建时间、响应时间以及所能承受的访问量来评测分布式倒排索引的性能;使用信息检索综合指标评测OntRank排序算法的准确性。本文通过语义与信息检索知识的结合,扩展了传统的概率检索模型,该方法既保留了关键字检索的便捷性,又提高了查询准确率,为语义关键字检索工作开辟了新的思路。
其他文献
由著名华人数学家、菲尔兹奖获得者丘成桐教授设立的丘成桐中学科学奖越来越受到全球华人中学生的关注,越来越多的中学生参与到这项赛事中.本文介绍了丘成桐中学科学奖和其中
托尼·莫里森一生都在致力于弘扬美国黑人文化,并以其杰出的成就成为第一位获得诺贝尔文学奖的美国黑人女作家。作为一名美国黑人女作家,托尼·莫里森既受过西方传统文学的教
企业运行中应收账款不可或缺,我国企业应收账款管理方面存在的问题可以从管理组织、日常分析、管理制度三个方面加以剖析。 The accounts receivable are indispensable in
魏晋玄学盛行一时,给当时文坛造成一定影响。对于这种影响,文论也应该有一定的回应。南北朝接踵魏晋,此期文论家对文坛上这股玄风也都有所评价。尽管他们对其关注的程度和评
该文从一个实际问题出发,讨论了一类退化型运输问题的求解方法,证明了某些添加0运量的方案相互等价的事实,从而简化了此类问题的运算。
中国30余年来的金融改革,尤以商业银行体系为主导、包括农信社、村镇银行在内的信贷机构体系的改革,无不体现为增量改革的特征,而近段时期小额贷款公司的推出,仍然是增量改革
贫困问题是当前我国社会发展面临的核心问题之一。旅游开发扶贫是一种见效快的造血型、开发型扶贫方式,成为大别山区经济社会发展的必然选择。文章在分析旅游扶贫相关研究与
上个世纪,S·沙伦、约翰逊兄弟等人经过不懈的努力,总结出小组合作学习的理论成果,这些丰硕的成果引进以后,我们的课堂更显活力。王坦、胜群力、傅永曙等老师勤于实践,笔耕不
目的:探讨宫炎平胶囊联合奥硝唑治疗慢性盆腔炎的临床效果。方法:选取在2015年1月至2016年1月期间我院收治的986例慢性盆腔炎患者,将所有的患者随机分为两组,即研究组和对照组,各
近年来,随着时代的发展,信息技术在小学语文教学中的应用已经成为一种潮流,针对这点,众多专家和教师展开了激烈探讨。到底在小学语文教学中应如何应用信息技术,文章对此进行