【摘 要】
:
专利检索与普通的文本检索有着极大的不同,专利文本包括权利声明、摘要、全文等不同部分,自然不能简单地将普通文本的检索方法应用到专利检索当中来。专利检索通常面临着召回
【机 构】
:
武汉大学软件工程国家重点实验室,武汉大学计算机学院
【基金项目】
:
湖北省科技支撑计划(2015BAA127)
论文部分内容阅读
专利检索与普通的文本检索有着极大的不同,专利文本包括权利声明、摘要、全文等不同部分,自然不能简单地将普通文本的检索方法应用到专利检索当中来。专利检索通常面临着召回率低下的问题,首先,由于专利文本具有极强的专业性,有着复杂的术语表达方式,用户输入的关键词通常无法明确捕捉到检索意图,导致检索结果不理想。其次,专利撰写时有意识地制造与众不同的词汇,导致相关专利无法被检索到。目前有很多的研究方法都旨在提高专利检索的召回率,但是仍然有许多问题有待解决,检索效果有待改善。提出了一个基于词向量的专利自动扩展查询方法,在词向量的基础上,构建一个关键词查询网络,通过稠密子图发现算法来寻找扩展词集合,提高扩展词的有效性。在CLEF-IP 2012数据集的基础上进行了充分的实验,实验结果表明,本文提出的算法能够保证扩展词集获取的灵活性和有效性,同时能进一步提高专利检索的召回率。
其他文献
预测子空间聚类PSC算法由于建立在PCA模型下,无法鲁棒地进行主元分析,导致在面对带有强噪声的数据时,聚类性能受到严重影响。为了提高PSC算法对噪声的鲁棒性,利用近年来受到
2017年秋拍在即,陈振濂与浙江美术传媒拍卖公司第三次高举“盛世国学”旗帜,以有效组织一年一度的书法公益专场拍卖,今年的主题为“简牍书法研究”,同样是以文献研究为宗旨的《简
为了有效地评价各种失真类型双目立体图像的质量,提出利用多核学习机学习立体图像平面纹理信息和3D映射信息的通用无参考立体图像质量评价IQA方法。该方法首先利用立体匹配模型对左右视图进行处理,获得相应的视差图DM和误差能量图DMEE;对左右视图、视差图和误差能量图进行相位一致性和结构张量变换,获得它们的平坦区和边缘区;分别提取左右视图两个区域纹理特征作为平面信息,提取视差图的纹理特征和误差能量图的统计
复杂网络重叠社区结构的划分已成为复杂网络研究的一个热点,目前已提出了很多关于社区结构发现的算法。提出了一种基于个体从众的演化算法ICEA,基本思想是由节点邻居组成的个
近些年,随着社会的不断进步以及国际生态环境状况的日益恶化,人们越来越重视生态环保。其中,对于大型建筑工程的“绿色施工”理念也多次被提出,并得以广泛的应用。本文根据“
摘 要:生物是一门研究生命组成和生命现象的科学,它对于学生认知自我、认知周围环境有很大的帮助。尤其是近年来,随着科学技术的发展,生物在人们的生产生活当中,发挥着越来越中重要的作用。学好生物可以说对学生的全面发展很重要,可是由于受到各种因素的影响,现代初中生物教学的现状依旧不甚理想。为此,初中生物教师应当把握好新课改的机会,积极寻求改变,依据学生的心理需求和认知特征,采取合适的教学策略,以期切实促进
摘 要:本文中的小学体育教学有效性重点从学生的角度着力,并在此过程中,培养学生的团队意识和拼搏精神,培养学生的体育优秀品质,增强体育教学的高效性,并分别从合作教学法、组间竞赛法以及互动教学法,旨在为学生创设具有自主性、竞赛性以及互动性的小学体育模式,获得良好的体育教学质量。 关键词:小学体育;体育教学;教学有效性;教学策略 在现阶段的小学体育教学过程中,部分体育教师将教学的重点,集中在培养学生