【摘 要】
:
产品的创新在一定意义上就是功能的创新,挖掘专利中的创新知识有利于进行技术规避,打破专利壁垒。知识图谱是一种高效的知识表达模型,能够有效地发现图谱内各实体之间的联系,为智能搜索、知识问答等上层应用提供支持。因此,在专利分析的基础上,挖掘出有效的专利知识,构建面向创新的专利知识图谱具有十分重要的作用。从专利中提取创新知识是专利分析研究的重点,目前专利分析在特征提取方面做得并不是很好,存在特征抽取不全、
论文部分内容阅读
产品的创新在一定意义上就是功能的创新,挖掘专利中的创新知识有利于进行技术规避,打破专利壁垒。知识图谱是一种高效的知识表达模型,能够有效地发现图谱内各实体之间的联系,为智能搜索、知识问答等上层应用提供支持。因此,在专利分析的基础上,挖掘出有效的专利知识,构建面向创新的专利知识图谱具有十分重要的作用。从专利中提取创新知识是专利分析研究的重点,目前专利分析在特征提取方面做得并不是很好,存在特征抽取不全、抽取不合理等问题,不能很好地挖掘专利之间的关系。构建面向创新的专利知识图谱不仅需要良好的本体架构,还需要丰富的数据填充和关系建立。针对上述问题,本文的主要贡献包括:(1)对面向创新的专利知识图谱关键技术进行了研究,首先采用自顶向下的方式构建面向创新的专利知识图谱的相关本体。并以化学领域专利知识图谱的构建为例,设计并实现了从知识抽取,知识发现,知识存储的相关技术方案。为了提高召回率,更多的覆盖专利知识,以维基百科、同义词词林等为基础,进行面向创新的专利知识图谱元数据的扩展工作,经过实体链接将扩展词链接到知识库中。(2)在知识发现阶段,提出了一种动态聚类混合模型,该模型结合深度学习的相关技术,将表达相似功能的专利进行功能信息特征抽取,该模型特征抽取主要分为深层语义表示部分和功能词语关注部分。深层语义表示部分使用双向长短期记忆网络联合注意力机制抽取文本序列特征、卷积神经网络抽取文本嵌入特征、改进的权值潜在狄利克雷分布抽取文本主题特征;功能词语关注部分加入功能词语,加强这些功能词语在聚类中的作用。在聚类过程中调整网络参数,完成专利聚类,挖掘不同专利之间的关系。之后在创新知识抽取过程中,利用主题抽取模型分别与TF-IDF、Text Rank算法相结合抽取创新专利知识。(3)使用图数据库Neo4j对整理好的结构化三元组知识进行存储。同时设计创新专利知识图谱的系统架构,构建了一个创新专利知识图谱平台,具有专利搜索和本体架构展示功能,提供友好的可视化界面和API服务,将提出的算法整合成完整应用。本文以研究所中已有的专利数据和购买的专利文本为实验数据,在同样实验条件下,针对动态聚类混合模型进行了相关对比实验。该方法的F-measure为87.954%,在对比实验中值最高,验证了该模型的有效性。
其他文献
皇冠梨在出口海外市场的过程中,会产生内部腐败变质而外观无明显变化的现象,从而导致商品会被全部拒收,造成巨大的经济损失。另外,在其品质检测过程中一直使用有损检测技术的感官评定方法,该方法一方面检测样本较少,覆盖面较小;另一方面其结果可靠性差、可重复性差。因此,本文特提出一种新型的无损检测技术,分别建立基于电子鼻嗅觉特征和视觉图像特征的皇冠梨分类模型,并将基于电子鼻技术和机器视觉技术的融合技术应用于皇
因果关系反映了事情之间先后相继、由因及果的发展关系。专利文本中的因果关系体现了专利的技术核心,有助于精准挖掘专利信息,也有助于专利知识图谱的构建。虽然因果关系抽取是自然语言处理领域一个经典的研究方向,但针对专利语料方面的研究较少。目前用于因果关系抽取的方法中,存在隐式因果关系抽取困难,边界识别模糊的问题。针对这些问题深入研究,主要工作包括:(1)构建专利因果指示词表。针对隐式因果关系抽取困难问题,
空间分析一直以来都是研究的热点课题,课题研究人员针对空间分析研究过程中遇到的各种问题提出了大量的解决方法。空间数据通常包含位置信息以及感兴趣的属性信息,空间数据分析是对空间数据提取或创建一组关于地理特征的新信息以对地理区域中的数据进行常规检查、评估、分析或建模的过程。对空间数据建立空间分析模型,有助于增强空间数据的估计和预测能力,提高数据的解释性和理解性。本文研究了栅格数据回归模型、地理统计数据回
During Photovoltaic solar cells manufacturing,visual defects inspection is carried out to guarantee the product quality and life span of solar cells.Solar cell surface defects can be classified into c
视频显著物体检测旨在利用计算机快速有效地从视频中获取感兴趣区域,有助于后续的目标提取或者定位等处理。视频由于摄像机抖动、光线变化、镜头突变切换和摄像机运动等因素,容易产生物体形变,模糊和无意义背景干扰等问题,这使得显著物体的检测任务面临着巨大的挑战。视频显著物体检测分为基于手工特征方法和基于深度学习的方法。基于手工特征方法采用无监督机制,准确率较基于深度学习的方法低。基于深度学习的方法大多是有监督
基于相位计算的光学三维测量技术具有精度高、可实现、非接触、系统结构简单、灵活性好等优点,一直是国内外研究的热门之一。目前三维测量技术己经广泛应用于工业检测、逆向工程、测绘导航、医学工程等领域。传统的三维测量系统由一个摄像机以及一个投影仪组成,容易受到视场范围限制造成视觉盲区,会存在十分明显的数据缺失现象。为了解决复杂形貌测量问题以及扩大系统视场范围,本文采用双相机和投影仪组成的多节点系统进行测量。
基于机器视觉的带钢表面缺陷检测系统对提高产品质量、提升智能化制造水平具有重要作用。但是,在实际生产中很难获得种类齐全、分布均衡的缺陷样本库,基于机器学习方法依赖于大量有标签的数据而难以发挥它的优势。在异常检测领域,一分类方法可以通过拟合大量正常类数据的分布来完成正负样本划分,而生成对抗网络(Generative Adversarial Networks,GAN)能够对复杂和高维分布的数据建立模型。
行人再识别是依据当前监控场景中出现的行人目标,通过计算机视觉技术,对在不同场景监控摄像头中拍摄的行人进行再识别。但在实际应用中,行人的图像或视频并不能被充分捕获到,被查询人样貌的自然语言描述可为行人再识别提供更有用的信息,因此,基于自然语言描述的行人再识别成为了研究热点。基于自然语言描述的行人再识别属于跨模态匹配问题,图像和自然语言描述文本的特征异构明显,为此本文构造了双分支提取特征的网络模型,并
无重叠条件序列模式挖掘是一种间隙约束序列模式挖掘方法,与同类挖掘方法相比,该方法更容易发现有价值的频繁模式,其核心问题是计算给定模式在序列中的支持度或出现数,进而判定该模式的频繁性,而计算模式支持度问题实质是无重叠条件模式匹配。当前研究采用迭代搜索无重叠出现,然后剪枝无用结点的方式计算模式的支持度,其计算时间复杂度为O(m*m*n*W),其中m,n和W分别为模式长度,序列长度及最大间隙。为了进一步
随着脱贫攻坚工作的圆满收官,加强脱贫攻坚与乡村振兴的有效衔接成为社会各界关注的焦点。笔者通过调查赣南L村的基本概况,分析了2016—2020年L村的贫困村治理方式,充分挖掘乡村实践的经验,从乡村的实际情况出发,探索出一条推进脱贫攻坚与乡村振兴衔接的路径。