基于图结构的科学文献检索系统设计与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:plumblossommeihua
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
垂直领域搜索的科学文献检索通过匹配输入检索关键词和文献的结构语义增强检索性能,支持科学研究活动。本文通过半监督文献和检索双层图结构语义模型,增强文献检索的准确性,以此为基础设计离线和在线流水式以及多种结构语义模型可插拔和融合的系统结构。具体工作包括:1、检索需求分析和离线表示学习与在线检索流水式可配置架构设计:分析文献图模型与检索关键词隐藏结构图模型的特征提取、索引、系统管理、数据库访问等关键功能。提出离线表示学习和在线检索相分离的从表示学习到检索的流水式系统结构,并针对多种表示学习算法,提出可配置、可插拔的模块化语义融合系统架构。2、半监督文献与检索双层图结构语义模型:词和词的共现关系、词和文献的包含关系、文献引用关系构成异构图,通过多种方式抽取词、文献的结构语义表示。将检索关键词集合作为短小文档处理,将文献图结构中的词共现关系泛化到检索关键词集合上,建立检索关键词的隐藏结构图,以此引入文献图结构中的语义,抽取检索关键词集合的结构语义。3、多种方式融合语义检索:针对多种方式获得的语义表示特点进行语义融合,通过融合后的文献图结构语义与检索关键词集合图结构语义,建立文献和检索关键词集合的语义匹配,提供可配置的检索服务。最后通过原型系统实现与测试,实现了科学文献检索系统的主要功能,在对系统关键模块的性能进行充分经验评估的基础上,对系统各功能模块进行集成测试,测试结果表明系统可满足用户的核心功能和性能需求。
其他文献
目的:比较腹腔镜下胆囊切除+胆总管探查取石术(LCBDE+LC)一期缝合和同期内镜下逆行胰胆管造影联合腹腔镜下胆囊切除术(ERCP+LC)治疗胆囊结石合并胆总管结石的疗效与安全性。方法:收集2015年10月至2018年10月在东南大学附属中大医院接受微创手术的胆囊结石合并胆总管结石的患者资料,共184例,根据手术方法,将患者分为LCBDE+LC一期缝合组(112例)和同期ERCP+LC组(72例)
随着互联网的普及,人们迈入信息化时代,方便、准确获取信息变得越来越重要。问答系统摒除了传统搜索引擎只能利用关键字来定位类别或选项的弊端,可直接根据用户输入提供答案。针对警务应用,现有警务系统并不支持自然语言的查询,仅停留在计算机端操作,并以关键词方式进行查询,无法统一入口,操作繁琐。因此有必要提出一套服务于业务查询的警务问答系统,使警务人员可以基于自然语言问答的方式进行情报获取与案件的侦办。本文通
背景人们可能有80-90%的时间都是在室内度过的,室内空气污染对健康造成的危害是世界性的重要的公共卫生问题。全世界每年由室内空气污染每年造成的死亡人数月为160多万。室内充分的通风是保持室内的空气良好的重要措施,通风不良是造成室内空气污染的主要原因之一。室内空气质量评价的指标有多种,其中二氧化碳就是空气清洁的重要评价指标之一。室内空气污染可导致病态建筑综合症(sick building syndr
桥梁作为国家和地区交通基础设施建设的重要工程结构物,起着交通咽喉要道的作用,直接影响着整条道路的交通运输能力和安全,具有重要的经济、社会和战略意义。近些年来,桥梁混凝土结构的耐久性问题日益突出,较多的现役预应力混凝土桥梁在交通荷载、自然环境等作用下,在使用期发生了混凝土表面开裂、碳化、钢筋锈蚀和混凝土剥落等一系列问题,从而引起混凝土桥梁裂缝或挠度过大和承载能力严重下降。但现有的研究关于桥梁耐久性的
在线社交软件的普及使用正在重塑人们的交流表达方式。人们不再满足于在线下加入能让自己产生归属感的群体或兴趣社团,而将注意力转移到了加入在线网络群体。在线社交网络中,一些有着相似属的个体倾向于形成群体。绘制群体画像为用户决定是否加入一个群体提供了先验知识,另一方面群体画像有助于理解群体的形成与演化。现有对群体画像的研究多局限于采用特征统计或基于概率模型的方法,缺乏对生成画像维度的语义多样性进行检验;而
随着图像处理、大数据技术的进步以及高性能计算能力的提高,以车辆基础信息识别、车辆行为识别、车辆布控与缉查为代表的车辆识别系统在智慧交通中扮演着重要的角色。随着目前抓拍的数据量越来越大,相关部门对细节识别的需求越来越多,目前以车牌识别为特点的一次识别渐渐不能满足需要,以细节识别为特点的二次识别技术逐渐被业界关注,并展开研究,有效进行车辆的二次识别已成为业内亟需解决的问题。本文借鉴了人脸识别、车牌识别
图像配准是图像融合的核心,也是目前的研究热点。它广泛应用到医学领域,可用于疾病诊断以及制定治疗计划与评价。配准精度在医学图像配准算法中是首要评价指标。但是由于医学成像设备的自身仪器干扰以及成像环境的复杂性,产生的医学图像有很大的噪声,使得在图像配准中难以保证精度,同时医学图像配准算法在配准速度以及鲁棒性上也有很多问题需要解决。根据对配准算法的研究,本文提出一个基于特征点的异源图像配准算法。1.介绍
近年来,伴随着房地产开发项目的迅猛发展,房地产项目的管理组织问题成为项目管理者的重要关注点。施工招标活动作为房地产开发项目建设过程中的重要组成部分,其管理协调问题同样受到大量研究学者的青睐。施工招标活动具有涉及面广、工作量大、招标文件多等特点,涉及的职能部门也很复杂。在房地产开发项目中,如何科学、合理地编制、签订、管理好这些招标文件是招标管理工作的重要组成部分。另一方面,界面管理为项目管理提供了新
随着直流输电系统的持续建设以及新能源发电的大规模并网,电力电子化设备在现代电力系统中的比例不断提升,电力系统动态特性越发复杂,电网的仿真分析手段由传统的离线仿真与离线分析逐渐向实时仿真与在线分析发展,这也对系统元件模型和参数的准确性提出了更高要求。目前针对同步发电机、励磁系统、调节器、电力负荷等传统设备的模型参数测辨技术已经较为成熟,但对于以直流输电系统为代表的电力电子化设备模型参数辨识方法尚缺乏
政府投资审计工作已经过多年的发展,在审计理论、审计方法、审计程序、审计内容等方面越来越规范,但在实践中依然存在着不少问题,有待研究解决。论文首先对政府投资建设工程审计相关概念作了阐述,其中,工程跟踪审计和结算审计是政府投资审计中两个非常重要的环节,并且在政府投资工程的监督管理中起到重要的作用;接着分析了南京市A区政府投资工程建设现状和工程审计现状,尤其是政府投资工程跟踪审计和结算审计中存在的问题。