中文医疗命名实体识别的研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:bb790858108
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
命名实体识别的主要工作是从无结构的文本中提取出特定实体,如人名、地名等,是一项重要的研究工作。近些年来,计算机技术的发展带来了宝贵的有标注的电子医疗数据,使得我们可以利用深度学习相关的技术进行信息提取,为未来智慧医疗的建设、知识图谱的构建等工作打下基础。相对于开放域的命名实体识别,人们在医疗领域的命名实体识别上所做的工作较少。医疗上的实体识别有其特定的困难,如实体专业知识性较强、部分类别实体过长、存在中英文混合的复杂实体等。虽然开放域的命名实体识别已经有相当多的研究经验,但针对医疗命名实体识别还需要“对症下药”。针对这些问题,本文主要的工作如下:·基于外部知识增强的方法针对医疗领域中专业知识较强,且医疗领域外部资源丰富,本文探究如何利用这些外部资源并将其融入到模型中。本文构建医学词典,并提出两个外部知识获取方法:特征模板法和分词标注法。特征模板法提取上下文文本特征,分词标注法提取实体位置及类别标签特征,并融入到长短时记忆网络中。实验结果表明,引入外部知识能够有效地增加模型识别实体的准确率。·基于自注意力机制的模型改进针对医学领域部分实体较长的问题,在预测时容易发生实体断裂、边界错误等情况。本文通过向模型中引入自注意力机制,即引入字符与字符之间的相关性,使长实体内部字符的凝聚力更高,缓解长实体预测断裂、预测边界错误的情况。实验结果表明,模型在整体识别效果上有提升,对长实体预测正确率也有明显上升。·基于级联分层的命名实体识别为进一步提升模型的效果,提出了级联分层识别模型,将原本单任务的命名实体识别改为多任务模型,一个任务划分实体边界,另外一个任务预测实体类别。同时结合自注意力机制,并提出两种将外部知识融入到模型的方法:嵌入层融合法和分层融合法,后续在CCKS数据集上的实验表明,模型的识别效果有所提升。分析结果表明分层融合法效果更优,对比Bi LSTM-CRF模型的F1值提高了3.3%,将命名实体识别视为多任务的级联分层识别模型能够更好地融合外部知识。
其他文献
检察刑事附带民事公益诉讼制度自2018年正式确立以来,附带民事公益诉讼便成为了我国检察机关提起民事公益诉讼的主要诉讼模式。调解作为一种有效的纠纷解决方式逐渐从传统的民事领域渗入检察刑事附带民事公益诉讼领域。然而,与实践领域的表现形成对比的是我国在检察刑事附带民事公益诉讼调解制度方面还存在立法空白且针对该方面的理论研究也明显滞后。调解制度作为中华法系的一大特色,其在检察刑事附带民事公益诉讼中不仅能够
本文立足于类型化视角,针对司法拍卖标的物负担不动产租赁权、负担优先购买权、错误拍卖第三人财产三种典型的权利瑕疵,逐一分析其对买受人权益的不利影响,并有针对性的提出保护买受人权益的方案。本文由四章构成:第一章梳理了有关司法拍卖法律性质三种不同的理论,明确本文采取折中说的立场;探析权利瑕疵概念的基本定义,并对司法拍卖实务中涉及权利瑕疵的案件进行统计分析,据此将司法拍卖标的物的权利瑕疵划分为负担不动产租
本文提出了一种在需求分布未知且仅有销售数据(即删失需求)的情况下进行库存管理的数据驱动算法——非参数平均库存管理算法NAIM(Nonparametric Average Inventory Management).对于同样的库存管理问题,Huh(2009)在其研究[1]中提出了一种自适应库存管理算法AIM(Adaptive Inventory Management),AIM 是一种在线学习(Onl
价值类型作为资产评估的基本要素,是决定评估结果的重要因素之一。通过对相关文献与现有混合所有制改革中的资产评估报告的分析与阅读,本文发现在国有企业混合所有制改革中的资产评估普遍采用单一市场价值作为企业价值评估的价值类型,然而出于激活国有资产的目的,混合所有制改革中的战略投资人一般能标的企业产生正向的协同效应,因此符合条件的投资人数量往往有限,难以形成充分的市场竞争。如此时仍旧采用市场价值作为价值类型
近年来,我国房地产市场热度居高不下,随之衍生的商品房信贷业务也迅速发展。许多消费者由于资金的问题无法付清房屋全款,而预购商品房抵押贷款可以很好地解决这类消费者的问题。预购商品房抵押预告登记制度围绕着开发商、购房人、银行三方主体开展,其具体方式是购房人在支付了首付价款后,以所购商品房作为抵押向银行贷款,剩余价款直接由银行向开发商垫付。特别之处就在于该抵押物尚未完工,尚未满足办理正式抵押登记的条件。若
2016年我国数字普惠金融的概念正式提出以来,与传统的普惠金融模式不同,数字普惠金融更加强调数字技术与传统普惠金融模式融合发展,但是数字技术的发展时间较短,数字普惠金融相关的体系并不完善。因此,在数字普惠金融发展的过程中,它能否很好地与我国的实际相结合,提高普惠群体的金融服务水平,提高被排斥在金融服务群体以外的社会群体的金融服务水平,提升其收入水平进而缩小城乡收入差距,促进社会公平正义就更加值得考
企业的经营是一个持续、复杂的过程,一个企业的发展离不开企业内部资源与外部市场环境的契合。当外部机会来临的时候,企业要利用自身的竞争优势,把握机会。而面对威胁的时候,企业更应全面分析外部环境的压力,结合自身情况,选择防御战略或收缩战略等。A公司是一家小型独资外贸企业,有自主男装品牌,设计生产地在中国,销售市场面向全球。在国际化的市场拓展中,A公司以其独有的资源优势,迅速积累了大量中东市场客户。然而,
随着消费升级及共享经济的不断发展,我国旅游市场由跟团观光游向沉浸式休闲体验游转变,更具个性化的住宿形式——民宿应运而生。民宿,被称为有灵魂、有温度、有情怀的新住宿业态,受到特定消费群体的追捧。为了更好地迎合民宿消费需求、增强消费粘性、提高经营效益,本文以民宿消费者为研究对象,探究感知价值对顾客契合的影响路径,以期为民宿经营者提供有效的经营管理建议,助力民宿业态健康可持续发展。本研究以认同理论、价值
随着我国社会老龄化程度的加深,改革企业与机关事业单位退休保障制度双轨制,建立和完善养老保障多支柱体系,对保障老年人生活水平,维持社会稳定有着积极意义。经过多年的试点探索,2015年我国养老保障制度迎来突破,国务院印发机关事业单位工作人员养老保险制度改革的决定,开始对养老保险制度改革“动真格”,改革的一项新亮点是建立职业年金制度,它的建立有助于完善我国养老保障第二支柱,建立健全机关事业单位补充养老制
在市场竞争日益激烈的背景之下,企业越来越期望员工在完成本职工作之外,自愿作出对组织有益的角色外行为以提高企业竞争力。然而,在中国的组织情境下,员工所表现出的公民行为可能并非出于自愿,而是迫于上级领导或组织内部的压力不得不实施角色外行为,如中国职场中广泛存在的强制加班等现象。这一背离组织公民行为初衷的行为,被学者称为强制性公民行为(Vigoda-Gadot,2007)。作为非自愿的组织公民行为,现有