基于上下文关系的命名实体识别方法研究与应用

来源 :北京化工大学 | 被引量 : 0次 | 上传用户:shanqishuai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网在工作生活用中的普及与发展,各行的工作流程逐渐从数字时代进入了信息共享时代,也因此得到了越来越多的效率提升。目前,信息共享已经成为了提高工作效率的重要渠道,也是智能化生活中不可缺少的环节之一。在医疗卫生领域中,由于缺乏一些与专业学科相关的预备工作,导致了其中如电子病例等非结构化文本档案中蕴含的信息难以得到充分利用,影响了相关工作的效率。为了在专有领域文档中识别有效内容,以及检索关键信息以提高文档信息的可用性,本文从减少识别方法的预备工作与提高已有工作的利用率两个角度出发,提出了一种基于中文文本的专有领域命名实体识别方法。1)为了减少识别方法在领域应用前的预备工作,本文提出了基于简单标注集合的中文文本分词模型,该模型的核心内容是应用在条件随机场模型上的复杂特征函数。复杂函数在基本标记序列上可以进行更深层的特征提取,利用中文文本在行文与表达过程中特定的方式与规律,从训练样本中获取与语法规则更相关的信息,从而提高了样本集信息的利用率,也间接减少了训练样本的标注工作量。2)从提高已有工作利用率的角度出发,本文提出了基于依存关系的语义识别模型,该模型的原理是利用了词汇之间的依存关系,对句子中词汇之间的搭配情况进行概率拟合。利用这种拟合关系可以将其它领域的已有工作作为语义依存关系的框架,进而通过知识扩充的方式应用在专有领域的识别过程中。3)针对未登录命名实体难以识别的情况,本文利用了基于依存关系的语义模型,从语境关系的层次对实体进行识别,提高了识别模型对未登录词汇的处理能力。
其他文献
[目的]观察甲磺酸阿帕替尼治疗晚期难治性骨与软组织肉瘤的有效性及安全性,分析影响患者无进展存活期的可能相关因素。[方法]纳入云南省肿瘤医院骨科二病区2017年6月至2018年9月收治的21例晚期难治性骨与软组织肉瘤患者,予以甲磺酸阿帕替尼片,500mg/天,连用28天作为1个疗程,主要观察指标为疾病无进展存活期(progression free survival,PFS),次要观察指标为总存活期(
页岩烧结保温砌块是一种以页岩为主要原料,煤矸石、粉煤灰等工业废料作为掺和料的新型节能烧结墙体材料,能满足我国建筑外围结构节能65%的目标要求,其轻质、价廉、环保、高保温隔热效果等特点克服了传统烧结砖的诸多弊端,展现了良好的市场前景。目前,国内对页岩烧结保温砌块主要是针对材料性能的研究和制作工艺的开发,尚未对该类砌块构成的墙体抗震性能进行深入地探究。本文在试验研究的基础上,利用ABAQUS有限元模拟
基于风险的检查(RBI)是一种计算工具,主要用于石油和天然气领域,支持识别高优先级物质(即风险高的物质)与低优先级物质(即具有高优先级物质的物质)。低风险)。这种方法允许资
半导体铋基化合物中的Bi2MoO6由于其特殊的电子层结构和适当的带隙能在光催化方面具有潜在的应用价值,但催化过程中仍存在可见光利用率低、光生电子-空穴对复合率高等问题。
本文基于微波烧结独特的烧结优势,制备了亚微晶Al_2O_3/SiC复合陶瓷刀具。本文设计了Al_2O_3基复合陶瓷刀具材料体系,优化了助烧剂(MgO、Y_2O_3)、增强相SiC颗粒含量及脱胶工艺参数;研究了微波烧结Al_2O_3陶瓷晶粒生长动力学与致密化机制,确定了两步烧结工艺,采用微波两步烧结方法成功制备出细晶Al_2O_3/SiC复合陶瓷刀具;通过切削实验研究了所研制刀具的切削性能与失效机理
超白玻璃因其优越的光学性能而应用非常广泛,作为玻璃主要原料的石英砂对玻璃的性能起到决定的作用。通过对收集的石英砂的化学组分、粒度及形貌进行了分析,为后续在玻璃熔制
在纳米尺度,几何形状是影响单个纳米结构的物理性质的主要因素之一。因此,新的几何结构将使纳米材料具有传统块体材料所没有的特殊性质和性能。对于单个纳米结构的阵列组装,
煤与瓦斯突出是在煤炭开采过程中产生的复杂动力现象,表现为短时间内向巷道空间喷出高压瓦斯-煤二相流,此现象会造成严重的井下事故。在煤层中形成水合物能够降低煤层中的瓦
当下所有飞机制造商推出新型号飞机在取得适航证进入市场前都必须通过噪声方面的适航审定,噪声、排放等环境相关的适航审定项目重要性几乎等同于性能方面的适航审定。飞机在
为了克服磷虾群算法由于种群多样性下降而导致算法早熟的问题,本文提出了一种新的基于涡流搜索算子的磷虾群全局优化算法(VSKH),用于求解函数优化问题。主要的改进内容是向磷