基于知识的文档相似性分析技术研究

来源 :中国电子科技集团公司电子科学研究院 | 被引量 : 0次 | 上传用户:ycmk07js2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为促进科研事业发展,国家每年投入大量的科研费用,设置多项项目支持,来自不同领域的科研项目也急剧增多,增加了科研重复立项和科研项目成果判断的难度,传统的专家评审已经远远不能满足大数据量的需求,研究对项目建议书及相关文档的相似性分析系统成为当前亟需进行的课题。研究如何对已有的项目文档知识充分利用、以及文档语义的精确理解对于项目管理意义重大,一方面可以根据指定文档精准搜索到相关文档集,量化科研项目的立项重复性程度;另一方面,可以精准发现已有的相关技术和研究水平,辅助评估项目的先进性。然而当前技术实现对项目文档的精准理解还存在很大的技术挑战,只能识别出文档内容相似关键词或语句的包含性,存在的语义理解能力弱、搜索精准性不足的问题。为此本文围绕项目建议书等项目相关文档的相似性分析需求展开研究,从相关性、重复性等角度分析知识库文档之间的相似性。本文的研究工作主要包含以下两个方面:一、文档相关性分析技术,由于文档各部分内容重要程度不同且冗余信息较多,该部分采用知识画像将文档描述为多个维度、多个粒度的知识条目,对不同维度赋予合理权重,对不同的粒度内容采用不同相似度计算方法,采用特征匹配、要点知识分析来代替自然语言的全文匹配,提高搜索准确率和召回率。二、多源组合的文档判重分析技术,项目建议书的核心内容为创意部分,针对这部分的相似度检测本文进行了多源组合的文档判重分析技术研究,主要解决文档核心内容来自不同文档的情况,该部分提出以条目为分析粒度,并针对行文改写后判重识别难点,对条目下进行要点知识建模,综合多种特征进行计算,实现对相关技术点的精确理解和识别。以上的研究为XX项目提供关键技术支撑。并在该项目系统中,使用实际数据进行测试,实验结果表明该系统能够对相关文档进行快速精准的查找,并对来自多个文档的创意部分有很好的识别。
其他文献
近年来,随着高酸性腐蚀油气田相继被发现和开采,大部分的防腐技术如添加缓蚀剂、阴极保护、管内防腐涂层等难以均衡经济性和可靠性。N08825/X60爆炸复合板,一方面综合了镍基
目的:基于前期的相关研究,通过构建Lewis肺癌小鼠模型,探讨肺岩宁对Lewis肺癌小鼠的抑瘤作用,以及肺岩宁对移植瘤组织中线粒体分裂融合信号的调控机制。方法:将30只C57BL/6小鼠随机分为模型组、紫杉醇组、肺岩宁组,并构建Lewis肺癌小鼠皮下移植瘤模型;造模成功后分别给予模型组(生理盐水灌胃;生理盐水腹腔注射)、紫杉醇组(生理盐水灌胃;紫杉醇腹腔注射)、肺岩宁组(肺岩宁灌胃;生理盐水腹腔注
党的十八大以来,生态环境问题被提到了全新的国家战略高度,“绿水青山”与“金山银山”受到了同等重视。环境污染风险显现出突发性、流动性、不确定性和不可逆转性等特征,传统的“强制性行政执法规制”无法有效化解环境污染风险难题,并制约环境执法方式创新。简单“一刀切”的方式无法回应企业环境守法能力的差异性和守法成本的复杂性,无法促成企业采取更节能环保的技术、设备和工艺。在种种困境下,环保领域行政约谈制度应运而
湘潭地区传统土坯房民居墙体的营造技艺是当地匠人和居民在当地特定的自然环境和地理气候下,受到当地的人文文化因素、经济因素、生活习惯等各种客观因素的影响而创造出来的,是大自然和人类智慧的产物。本文以湘潭地区现存土坯房民居为研究对象,探索其墙体的营造技艺。研究内容主要分为四个方面:一是总结影响传统民居墙体营造手法的因素;二是研究湘潭地区传统民居墙体的形式及特征;三是挖掘湘潭地区传统民居墙体营建手法;四是
随着经济发展和社会进步,人们将更多地活动转入到室内环境中进行。因此,人们对室内空气质量以及热舒适的要求也不断提高。传统的空气调节方式以稳态空调策略为基础,但是在现
随着经济快速发展、城镇化进程加快,城市人口不断增加的同时城市生活垃圾产生量也不断增长,越来越多的城市不得不面对“垃圾围城”问题,迅速增加的城市生活垃圾不仅破坏了生
在哺乳动物的卵巢中,原始卵泡数目作为卵巢储备的评价标准,是所有发育卵泡的基础。控制育龄期女性原始卵泡的过度消耗,可以通过抑制部分原始卵泡的激活,使绝大多数原始卵泡仍
传统意义上,合金作为结构材料广泛应用于各种场合,近年来,高熵合金突破传统合金瓶颈以其独特性能引起国内外学者的广泛关注,但是目前关于采用激光制备高熵合金的报道较少。为
在高温高湿环境中,脱水现象构成了对大众健身人群健康和运动能力的极大挑战,许多大众健身爱好者在夏季高温高湿环境中由于脱水,而无法持续运动,甚至对健康造成威胁.为了解决
目的分析420名子宫内膜异位症(EMs)合并不孕的妇女行腹腔镜手术后非辅助生殖(ART)的妊娠结局及可能影响其妊娠结局的相关因素,探讨生育指数(EFI)对EMs合并不孕妇女术后非ART妊娠结局的评估作用,希望给EMs不孕妇女提供个性化生育问题咨询,指导其科学合理选择术后妊娠方式及时机。方法采用回顾性分析的方法,收集2015年06月至2017年06月就诊于河南大学人民医院妇产科(三级转诊中心)的子宫