基于CRFs的专利文献领域术语抽取方法

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:ddudi5460
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过对新能源汽车领域中文专利文献中术语特点的分析,提出利用条件随机场模型,分别基于三词位、四词位和六词位的字序列标注进行术语抽取的方法。以字为切分粒度,避免在术语抽取过程中因分词原因导致术语识别错误问题,并探讨不同词位标注集对术语抽取性能的影响。实验结果表明,基于六词位字标注的条件随机场模型术语抽取的性能最好,准确率、召回率和F值优于对比方法中基于词、词性、词长等信息作为特征的抽取方法,验证了所提方法的有效性。
其他文献
新闻视频由于其真实准确、内容丰富、信息量大等特点,成为人们获得信息的重要媒体类型。对于情报人员而言,新闻视频是一种公开的情报源,其时效快,且反映各国政治、经济、军事
目的探讨临床路径式护理教学在急诊外科临床护理教学中的建立与应用。方法选取急诊外科2013年1月~2014年12月大专护理实习生60名为对照组,选取急诊外科2015年1月~2016年12月
【正】 为了响应党的号召,向科学进军,图书馆应更好地为科学研究工作者服务。图书馆对科技图书的处理,应有更好的方法。一般图书分类法都把科技图书分为两大类——自然科学、
由于K均值算法易受噪声干扰且对初始粒子的选取较为敏感,在进行PHD状态提取时,难以获得稳定可靠的状态估计结果。对此,提出基于谱聚类的自适应新生目标强度状态提取方法,运用
针对教学优化算法(TLBO)在解决复杂实际问题时易陷入局部最优的缺陷,提出一种改进教学优化算法(MTLBO)。在教师阶段引进自适应基准消除“原点偏好”,在学生阶段引进分科学习
为解决现有高速公路逃费预测方法的准确率和稳定性低等问题,依据车辆收费数据提出一种基于IGA-IBP算法的预测模型。优化遗传算法中的变异算子和BP神经网络的隐含层和输出层之