基于BLSTM-CRF中文领域命名实体识别框架设计

来源 :计算技术与自动化 | 被引量 : 0次 | 上传用户:ERICAMBER
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为在不依赖特征工程的情况下提高中文领域命名实体识别性能,构建了BLSTM-CRF神经网络模型。首先利用CBOW模型对1998年1月至6月人民日报语料进行负采样递归训练,生成低维度稠密字向量表,以供查询需要;然后基于Boson命名实体语料,查询字向量表形成字向量,并利用Jieba分词获取语料中字的信息特征向量;最后组合字向量和字信息特征向量,输入到BLSTM-CRF深层神经网络中。实验结果证明,该模型面向中文领域命名实体能够较好的进行识别,F1值达到91.86%。
其他文献
汉画像中体现汉代物质文明的图式资源非常丰富,建筑、服装、农耕生产等汉画像图像就显示了汉代较高的物质创造水平。建筑中的门、阙、楼阁、庭院,服装中的深衣、襦、袴,农耕
针对矿用蓄电池机车在使用过程中存在工作能耗大、触头易损坏、经济效益差、在启动和制动过程中电流过大又不易控制等问题,研制了变频调速系统。该系统采用SVPWM(空间电压矢量)
骨骼肌胰岛素抵抗是2型糖尿病的主要病理性特征,但其发生机制仍不十分清楚。近来研究证实,炎症反应引起的细胞外基质(ECM)胶原纤维沉积导致骨骼肌胰岛素抵抗症状发生,原因与
形状误差的智能评定结果稳定性较差,掌握智能评定结果的概率分布特性及拟合方法对进一步提高该方法的可靠性有重要意义.文中以平面度误差粒子群算法评定为例,基于智能评定结
以培养学生专业素养为教学目标,适应就业岗位对技能人才的需求,改变传统单一课程教学模式造成的学生学习目标感模糊、对就业岗位认识不足等问题,实施纵横向教学。以纵横向教
目的探讨脑深部电刺激(DBS)和脊髓电刺激(SCS)神经调控治疗对持续性植物状态患者的促醒作用。方法 2011年7月—2012年12月北京军区总医院收治的持续性植物状态患者53例,筛选
乳酸菌素是一种纯乳酸菌产生的制剂,是将脱脂乳经杀菌、真空浓缩,再经乳酸菌发酵后干燥而制成的乳酸菌体及其代谢产物混合粉状物,可作医药用或食品添加剂,属疗效型乳制品。
以辽宁省15所高职院校辅导员为研究对象,运用胜任力冰山模型理论,采用文献查阅法、案例分析法、问卷调查法,构建高职院校辅导员职业胜任力模型,包括四个维度:职业态度、个人素质、
《园艺植物栽培学》作为一门理论与实际结合密切的课程,是园艺专业核心课程之一。本文阐述了对该课程教学的改革与实践,通过改革传统教学思路,激发学生的创新意识,提升学生的综合
工业控制系统已跨入网络化控制的新阶段,网络化工业控制系统已成为制造业控制、过程控制和测控技术等领域中的重要研究方向。阐述了网络化工业控制系统设计和实现中的一些主要