面向中文电子病历文书的医学命名实体识别研究——一种基于半监督深度学习的方法

来源 :信息资源管理学报 | 被引量 : 0次 | 上传用户:liongliong484
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子病历文书详细记录患者诊疗全过程,蕴藏的医学知识是电子病历中最丰富的,因此挖掘电子病历文书潜在的知识结构具有十分重要的价值.面向非结构化电子病历知识挖掘的首要工作是命名实体识别,现有的医学领域命名实体识别方法面临标注数据质量偏低、标注数据不足的问题,同时现有方法中均只考虑文本的序列特性,忽略文本中词间、字间的依赖关系,限制了命名实体识别效果.本文提出一种基于半监督深度学习的医学命名实体识别方法,即结合具有专家权威的中文百科半自动化实体标注法及BERT-GCN-CRF框架,对电子病历文本进行医学命名实体识别抽取.以真实电子病历文本作为实验对象,该模型获取的准确率、召回率、F1值均有明显提高,其中P、R和F1综合平均值分别为84.6%、84.0%和84.2%,同时人工标注工作量显著减少.本文提出的方法对电子病历的非结构化文本挖掘工作有重要意义.
其他文献
新一轮科技革命蓬勃兴起,全球科技竞争态势日趋激烈,在科技管理过程中,科学研判产业创新趋势、甄选布局关键技术攻关项目意义十分重大.本研究从产业链关键核心技术概念特征出发,融合处理科技论文、项目、成果、专利等多源信息,研究开发了基于LDA主题模型文本挖掘的关键核心技术识别方法,并以我国人工智能产业为例,在产业链各环节分析基础上,开展关键核心技术识别与技术预测,为政府和企业提供具有前瞻性、时效性和专业化的情报分析和决策支撑.
社交平台的兴起带来的网络内容治理成为数字平台环境下一个棘手的问题,以企业为代表的私人部门凭借着技术和资本的优势,在公共问题上的权力越来越大,甚至可以直接左右公共事件的讨论和决策.社交平台的治理问题涉及到国家(政府)、平台、用户等多主体之间的互动关系,呈现出复杂的博弈局面.本文以美国政府与社交平台之间的争端为引,研究美国社交平台内容治理的现状,从相关规定的制定与执行中发现,治理存在公权力私有化、政府与平台公私对抗、三角关系冲突等问题.
隐私问题成为影响中老年用户融入数字化生活的重要因素,探究不同移动应用情境下中老年用户的隐私关注行为的差异,能更全面地了解这一特殊群体的隐私态度和行为,帮助其提升隐私保护意识.本文设定沟通交流、信息获取、智能生活、休闲娱乐四种移动应用情境,利用多因素方差分析探究四种情境下中老年用户隐私关注行为的差异以及信息敏感度、网络知识经验、隐私侵犯经历三个因素在其中的交互作用.研究发现,中老年用户在不同移动应用情境下隐私关注程度存在显著差异,信息敏感度和隐私侵犯经历的不同水平对隐私关注程度有显著影响,与移动应用情境的交
在当前中国老龄化增速加快的社会背景下,对养老服务领域的供需平衡问题进行深入研究,希冀为进一步改革养老服务供给侧和提高养老服务水平提供参考.在界定养老供需主体的基础上,引入养老服务政策这 中介变量,以此搭建养老服务供需匹配框架和模型,通过对百度知道与知乎等平台中公民养老需求的采集和2005-2019年我国养老政策的梳理,对养老服务需求与政策供给的匹配问题进行实证研究.结果 表明,匹配模型能较好地测量养老服务的供需水平,挖掘出养老服务领域存在的政策供给不足、重物质轻精神、服务供给单 等问题.对此本文提出要采取
随着网络计量学和各种网络信息交流及传播平台的发展,需要有效的指标来衡量信息传播效率或舆情扩散速度,本研究尝试改进传统的科学计量学指标,提出适用于衡量微博信息扩散程度的网络计量学指标,以微博为节点、微博之间的转发关系为连线、相对转发次数占比为相对影响权重,建立有向加权微博转发网络模型,提出了四种衡量节点影响力和信息扩散程度的微博扩散因子.根据20个微博话题相关数据的实证研究,得到MDF-A和MDF-Ajo与平台原创人数排名之间的相关度接近06(双侧显著性值p<0.05),MDF-Aj和MDF-Ajo在衡量单
提出一种前沿专利技术识别方法,以期发现产业领域中的前沿专利技术.根据前沿专利技术具有高关注度、高中心性、高发展潜力、高科学关联度及高技术关联度的特征,设计各个特征计算方法.构建前沿专利技术识别指标体系,对计算出的结果分别进行归一化处理、灰色关联分析法计算,基于熵权法赋权计算前沿值.以人工智能领域为例进行实证研究.根据前沿值计算结果将2014-2019年前沿值排名前10且重复出现两次及以上的专利技术定义为前沿专利技术,结合申请量分为申请量较低但本身有很好的科学与技术基础及较高关注度的专利技术、在近几年申请量
“放管服”是推进我国经济社会持续健康发展的重大策略,在深化行政体制改革、加快实施简政放权的大背景下,高校国有资产领域的“放管服”是高校国有资产管理面临的一项重要任务.为规范资产管理、精简办事流程、下放职能权限,积极推行资产管理“放管服”,本文以中国民航大学为例,在资产分级分类验收、资产入账、资产使用、资产处置等方面精简业务流程,从制度建设、队伍建设和系统建设等方面完善监督管理、优化服务水平,取得了良好的成效.
政府信息资源生成效率定量评价和监督控制,对政府信息治理具有重要意义.本文以交通运输电子证照办理为研究对象,经理论验证和专家调研的方式选取三项投入指标和四项产出指标,构建“投入-过程-产出”的政府信息资源生成效率测定框架,采用超效率(DEA)模型,测定其生成效率和变化趋势,验证交通运输电子证照生成效率在政府信息资源生成效率测定上的可行性.结果 表明,以交通运输电子证照为代表的政府信息资源生成效率呈现整体下降趋势,且不同地理区域受政策和业务的影响较大,需更新管理手段、创新管理方式、增加技术投入,并通过调整投入
新医改政策对公立医疗机构的发展方向提出明确要求,既要坚持公益性,又要保持可持续性,这就要求公立医疗机构实现高质量发展.本文从绩效管理视角,用SOWT模型对基层公立医疗机构进行剖析,对其高质量发展进行探讨并提出优化路径,以供参考借鉴.
新政府会计制度下,行政事业单位为促进其持续进步和良性发展,亟须加强信息化建设,不断完善信息系统,开发各种功能模块,不仅要升级软件,还要更新硬件,实现一体化管理,促进财务和业务的紧密衔接,提高财务工作效率,本文对此进行了相关的阐述和分析,以期为相关学者带来一定参考.