【摘 要】
:
实体关联搜索被应用于许多领域,比如国家安全和生物信息学等。近年来,网络中出现的图结构化的语义网数据促进了实体关联搜索的发展,这些数据提供了比那些隐藏在非结构化文本中的数据更为明确的结构化语义关联,便于计算机发现和处理。随着语义网数据数量的急剧增长,成千上万的语义关联产生。用户往往只想通过查看一些重要的、有价值的、包含尽可能多信息量的关联,来了解实体及其之间的关系。因此,需要进行多实体间top-k关
论文部分内容阅读
实体关联搜索被应用于许多领域,比如国家安全和生物信息学等。近年来,网络中出现的图结构化的语义网数据促进了实体关联搜索的发展,这些数据提供了比那些隐藏在非结构化文本中的数据更为明确的结构化语义关联,便于计算机发现和处理。随着语义网数据数量的急剧增长,成千上万的语义关联产生。用户往往只想通过查看一些重要的、有价值的、包含尽可能多信息量的关联,来了解实体及其之间的关系。因此,需要进行多实体间top-k关联的搜索。多实体间top-k关联的搜索返回一个包含k个语义关联的列表,这k个关联有关于这个查询最大的打分和。实际上,top-k结果中的一些关联可能是相似的,它们显示了非常相近的语义,提供给用户冗余的信息。多实体间多样化top-k关联的搜索不仅仅考虑语义关联的打分,也考虑语义关联的多样性。为了进行多实体间多样化top-k关联的搜索,三个问题需要被解决。第一,如何度量语义关联的重要性,即如何对语义关联进行排序;第二,如何度量两个语义关联之间的相似度;第三,如何较快地搜索最优的多样化top-k语义关联。本文针对这些问题进行了探索,主要有以下两个方面的贡献:1.设计了一种多实体间关联排序的方法,排序原则是语义关联的结构大小和实体类型一致性,并基于该排序方法实现了一种多实体间top-k关联的搜索方法。2.实现了多种多实体间多样化top-k关联的搜索方法,提出一种综合考虑结构和语义的新方法来度量语义关联的相似性。
其他文献
我国近年大力提倡创新创业教育,而创业课程是创业教育的核心形式。在对全国21所高校创业课程质量调查的基础上,分析得出当前创业课程体系建设存在学生创业需求虚旺、创业课程
我国电视原创文化综艺节目是以中国优秀传统文化为主要表现内容,通过节目形态的自主创新,弘扬“中国价值”的一种兼具文化性、娱乐性、原创性等特征的视频节目形态类型。自十七届六中全会提出“建设社会主义文化强国”战略目标以来,我国电视荧屏上涌现出诸如《汉字英雄》、《中国诗词大会》、《传承者》、《见字如面》、《朗读者》、《国家宝藏》、《经典咏流传》等一系列现象级原创文化综艺节目,并引发了对该节目类型的研究热潮
新能源汽车被认为是未来解决汽车行业能源、环保、安全等问题最有利的措施之一,因而受到了政府和企业的极大关注。新能源汽车中最关键的汽车电子芯片之一就是动力电池管理芯
以氯甲基化苯乙烯 (CMS)、苯乙烯、2 ,2′-联吡啶 (Bpy)和 Cu Cl组成过渡金属催化原子转移自由基聚合反应体系 ,通过自缩合乙烯基聚合反应合成了带有端双键的超支化聚苯乙烯
随着我国素质教育的广泛开展,各个学科的教育都面临着新的问题与挑战,必须进行创新和改革。面向学习成长启蒙状态孩子的小学语文教学,也在此过程中得到了促进与变革。不仅课
十堰市将军河汉江大桥为(61+110+110+61)m的4跨预应力混凝土连续刚构桥,其中2、3号桥墩高度约29m,该桥采用悬臂浇注施工法,先边跨合龙,而后两中跨合龙。文章以将军河汉江大桥
文章阐述了EPC概念及特点,结合工程实践,针对EPC总承包项目实施中设计管理存在的问题,提出了解决之道。最后根据工程实践中各设计阶段,提出设计管理过程中应注意的事项,为设
在协同创新的背景下,针对高职英语教师职业能力现状,提出高职英语教师职业能力提升的途径:教师间的协同创新,提升知识及教学能力;教师与政府、企业行业人员之间协同创新,提升
时代的进步,科技的发展,对办公系统的要求越来越高,不仅要高效率的完成任务,还需要保证任务完成的高质量。设计的企业行政办公自动化管理系统提高了企业管理的质量水平,减轻
国内用于沥青路面裂缝填补的灌缝胶质量参差不齐,使用效果不尽理想,特别是低温性能普遍较差。为此,按照ASTM D5329的拉伸试验方法,对国内常用的11种灌缝胶进行试验和分析,提出适用