【摘 要】
:
理论术语的抽取是大规模文献内容分析和跨学科知识转移深度揭示的基础。作为一种特定类型的命名实体,理论术语涉及的学科多、文献规模大、特征复杂,也缺乏大规模的成熟语料,
【基金项目】
:
国家社会科学基金重大项目“情报学学科建设与情报工作未来发展路径研究”(17ZDA291),国家社会科学基金重大项目“我国网络社会治理研究”(14ZDA063)
论文部分内容阅读
理论术语的抽取是大规模文献内容分析和跨学科知识转移深度揭示的基础。作为一种特定类型的命名实体,理论术语涉及的学科多、文献规模大、特征复杂,也缺乏大规模的成熟语料,因而抽取难度较大。为提高理论术语的抽取性能并降低训练集的人工标注代价,本文构建了面向理论术语抽取的深度学习模型,并研究了该模型中理论术语的特征构造和标注方法,同时也提出了一种自训练算法以实现模型的弱监督学习。通过实验对比,分别验证了本文模型和自训练算法的有效性,不仅为理论术语抽取提供了更加有效的通用方法,也为其他类型命名实体的识别研究提供了方法参考。
其他文献
词汇语义表示是自然语言理解的基础。传统的基于语义词典的编码表示构建成本高昂,而独热表示又存在高维稀疏等缺点。词汇的分布式表示将词汇映射为低维稠密的实值向量,能有效
为有效解决金融行业的实际问题,提高应用数学专业学生的竞争力。基于当前国内的金融现状,探讨了经济数学函数模型、经济数学极限理论、经济数学衍生品、经济数学微分方程等在
视觉信息是人们获取外界信息的重要来源。作为视觉信息的主要表现形式之一,图像受到了广泛关注。本文首先针对颜色直方图忽略空间信息的问题,基于图像分块思想,利用图像区域不同、引起的关注程度不同的原理,引入Itti视觉注意模型,进行图像显著图的提取,基于显著图计算各分块的加权直方图。其次,根据视觉感知理论,提取多种图像情感信息特征,结合低层的颜色、纹理和形状特征以及高层的面部表情特征,生成复合的图像情感特
进入新时代,中国情报学与情报工作发展迎来了全新的发展机遇,亟需新的定位、新的认识、新的担当。针对当前情报学界的阵地论争与"情报"内涵式的共同契约,本文归纳了中国情报
中国牧业通讯杂志社在全国率先开展的国牧直通畜牧业生产资料连锁经营 ,被业内称为中国畜牧生产服务领域的一场革命 ,引起了社会各界的广泛关注。2003年3月29日至4月1日 ,全
目的 观察初产妇进行围生期健康教育后的生活质量及抑郁症状.方法 选取本医院2012年6月~2013年12月建档的初产孕妇148例,按围生期干预方式的不同分成两组:对照组在围生期给予常