【摘 要】
:
近年来,在网络信息技术的支撑下,以维基百科、Yago、Freebase等为代表的包含大量非结构化、异构数据的知识图谱得到了快速发展。然而,知识图谱数据具有体量大、内容丰富、类型多样、缺乏统一模式描述特点。因此,提取知识图谱模式信息,并形成摘要模式,对于提升知识检索、挖掘质量具有重要研究意义。现有的摘要模式挖掘方法得到的图谱模式存在以下问题:1)挖掘的效率低;2)用户很难控制算法的频繁度值,往往产生
论文部分内容阅读
近年来,在网络信息技术的支撑下,以维基百科、Yago、Freebase等为代表的包含大量非结构化、异构数据的知识图谱得到了快速发展。然而,知识图谱数据具有体量大、内容丰富、类型多样、缺乏统一模式描述特点。因此,提取知识图谱模式信息,并形成摘要模式,对于提升知识检索、挖掘质量具有重要研究意义。现有的摘要模式挖掘方法得到的图谱模式存在以下问题:1)挖掘的效率低;2)用户很难控制算法的频繁度值,往往产生大量的频繁子图模式;3)不同模式之间往往相互交叠冗余。同时,已有的研究成果仍然存在部分上述问题。针对这些不足之处,本论文提出了新的摘要模式挖掘方法,将知识图谱的摘要模式挖掘建模为优化问题,并证明目标函数满足次模性,利用次模函数边际效益最大化的数学性质对Top-k摘要模式进行贪心近似求解。实验结果表明,本文提出的摘要模式挖掘方法在挖掘质量和挖掘效率上均优于已有的双目标函数模型方法。本文的研究工作和创新点归纳如下:层次化的摘要模式的定义。首先,本文使用图模拟匹配方法给出摘要模式的判定准则。其次,实际应用中,知识图谱的标签往往带有层次信息关系,本文基于摘要模式判定准则提出考虑节点标签层次化结构的摘要模式定义。最后,由于不同的模式对知识图谱的概括能力不同,给出摘要模式的质量度量方法。这些理论研究成果,为摘要模式挖掘问题的建模和求解奠定了坚实的理论基础。摘要模式挖掘建模及求解方法的研究。本文提出新的摘要模式挖掘方法,将摘要模式挖掘建模为次模函数优化问题,该目标函数不仅能够提升挖掘的摘要模式质量,而且在形式上更为简洁且无需定义参数。同时,基于摘要模式挖掘问题给出对应的贪心近似求解算法及加速算法。最终,在真实数据集中验证了该挖掘方法的有效性。
其他文献
认知心理学家加德纳所提出的多元智能理论,打破了“一元智能”观的局限性,其众多优势对中国的教育教学产生了深远的影响。人际交往智能理论作为多元智能理论的重要方面,其特
国家能力的集中体现就是一个国家的制度能力,中国叠加转型的社会发展际遇与现代化发展诉求迫切要求国家制度能力的提升。国家制度能力基于制度类型主要指制度构建能力、制度实
<正>近日,被誉为"质量奥林匹克"的第44届国际质量管理小组会议在日本东京召开。会上,格力质控部"大圣归来"小组对"降低变频外机控制器器件破损故障率"相关研究成果做了精彩展
蔬菜采后损失是一个全球性问题,其中微生物侵染引起的损失最为普遍和严重。植物源防腐保鲜剂已引起世界范围内的极大关注,但存在成本高、使用效率低及作用靶向不明确等问题,
韩国电视剧《太阳的后裔》自开播以来在中国互联网络开启霸屏模式,这部中韩同步直播的韩剧在爱奇艺的播放量超过26.8亿,打破了2年前《来自星星的你》13亿的播放量纪录,掀起全
采用内包层直径为125μm的双包层掺镱光纤,搭建了谐振腔结构全光纤激光器系统,获得了1018 nm的高功率激光输出。通过优化光纤长度和控制抽运源波长,单模激光输出功率为254 W,
目的 探讨老年肺部细菌性感染合并真菌感染的原因。方法 回顾性地分析了 36例老年肺部细菌性感染合并真菌感染的相关临床因素。结果 老年肺部细菌性感染合并真菌感染与老
山水写生,不同于摄影,不是原封不动的照搬自然物,它是画者走进自然物,对客观自然目识心记,认真感悟后主观处理的绘画结果。自然山水的实体样貌是客观因素,而画者的体悟和感觉是主观
随着智能音箱、在线客服走进日常生活的多个领域,人们与机器对话的频率明显升高,面向开放领域的聊天机器人的重要性也就日益凸显出来。聊天机器人以模仿人类进行对话为目标,不仅可以降低企业在客服方面的成本,还能满足用户日常聊天的需求。因此,聊天机器人成为计算机领域的一个研究热点。目前面向开放领域的聊天机器人以数据驱动的模型为主,能够从规则驱动发展到数据驱动,主要得益于社交媒体的普及和计算机硬件的发展,社交媒
唐代城市酒楼众多,不仅是唐人饮酒之风的表现,更是唐代生活方式及社交方式变化的反映。唐代城市人口的流动性增大,流寓在外的人士的社交空间开始转向了公共的场所,可提供酒食