【摘 要】
:
病历文本中的时间信息及其关系对于疾病模式挖掘、数据结构化、临床决策等方面都具有重要的意义。电子病历中的时间实体可以反映患者的患病及治疗历程,与药物反应、症状、疾病等描述都有着非常强的关联。目前针对电子病历的研究多采用英文数据集,中文数据集较少,且研究多集中在医疗实体识别、医疗实体关系抽取等方面,对于时间实体及其关系的研究较少。针对该现状,本文基于中文抑郁症电子病历数据进行时间事件信息抽取研究,提出
论文部分内容阅读
病历文本中的时间信息及其关系对于疾病模式挖掘、数据结构化、临床决策等方面都具有重要的意义。电子病历中的时间实体可以反映患者的患病及治疗历程,与药物反应、症状、疾病等描述都有着非常强的关联。目前针对电子病历的研究多采用英文数据集,中文数据集较少,且研究多集中在医疗实体识别、医疗实体关系抽取等方面,对于时间实体及其关系的研究较少。针对该现状,本文基于中文抑郁症电子病历数据进行时间事件信息抽取研究,提出了适用于抑郁症电子病历的时间表达识别算法、事件识别算法,在此基础上进行了“时间点-事件-持续时间”关系抽取,实现了电子病历文本时间线的提取。具体研究成果包括:(1)提出了正则表达式与条件随机场相结合的时间表达识别算法。该方法有效解决了正则表达式覆盖不全面的问题,同时针对实体边界太长无法准确定位的问题,依据病历文本中时间表达的特征构建了时间修饰词词典、时间词典、医疗事件词典作为外部词典特征。并结合外部词典特征进行了递增式策略的多特征融合实验,经实验验证,本文方法及所选特征可以有效提取到病历文本中的时间信息。(2)设计构建和实现了基于注意力机制的字词融合实体识别模型(AttCW-LSTM)。该模型在基于字向量特征输入的基础上,融合了词语边界信息,有效解决了在使用基于字模型时虽避免了分词错误但忽略了词语特征及使用词模型时分词错误传递的问题。经过实验验证,与常用的LSTM-CRF模型相比,该模型在不借助任何外部特征的基础上效果得到了提升。(3)提出了一种对应抑郁症病历文本的时间关系。针对抑郁症电子病历文本特点,在“时间-事件”这种时间关系的基础上,提出了新的时间关系“时间点-事件-持续时间”,并利用时间-事件覆盖范围规则进行抽取。将时间表达识别与事件识别研究相结合,实现了电子病历时间线的抽取。(4)设计并实现了中文电子病历信息抽取原型系统。结合医生在实际工作中的业务需求,将研究成果应用于实际场景中,实现了有机结合。综上所述,本文通过对中文抑郁症电子病历文本进行时间识别、事件识别的基础上,提取了“时间点-事件-持续时间”关系,生成了电子病历时间线信息。为抑郁症疾病模式挖掘和病情诊治提供了新的思路。
其他文献
近年来,随着汽车数量的急剧增加,出现了车辆监管困难、车辆频繁被盗、交通事故频发等一系列严重的问题,因此研究一个良好的车辆识别系统具有十分重大的意义。现有的车辆识别技术在粗粒度的识别任务中可以取得良好的性能,但是当出现车辆图像背景复杂、角度各异以及种类繁多等问题时现有的识别模型仍然无法取得良好的效果,为了解决以上问题,本文提出了基于最优传输模型的车辆识别模型,主要的工作有:第一,对国内外车辆识别技术
近些年,环境污染、资源枯竭等社会问题日益凸显。面对这些社会问题,政府组织和商业企业纷纷出现“支持力度不足”以及“市场失灵”现象。社会企业凭借其以创新商业方式解决社会问题的思路,逐渐为解决上述问题提供了新的方法。但是在我国社会企业整体发展较慢的大环境下,社会企业在成长的过程中难以同时兼顾社会价值与经济价值,容易造成背离困境。现有研究关于社会企业的探讨还比较少,组织层面中社会企业价值的研究大多来源于商
核磁共振(NMR:Nuclear magnetic resonance)技术已经发展成为结构解析的标准技术。核磁共振屏蔽常数的理论计算是预测核磁共振波谱常数必不可缺少的工具。而且,其技术和方法
Sm(CoFeCuZr)_z永磁材料因其居里温度高、内禀磁性能优异和温度稳定性好等优点,在新能源汽车、高铁和国防领域等方面发挥了重要作用。本文首先对Sm(CoFeCuZr)_z磁体(牌号为32H和32L)进行了研究,阐明了不同牌号商业磁体性能差异的原因。随后对低矫顽力的商业磁体(牌号32L)进行二次时效热处理,分析了二次时效工艺对磁体磁性能的影响。在此基础上,通过调整名义成分和热处理工艺,制备了不
伴随着国家大力推进公共资源交易市场平台体系建设,借助信息化手段为各类使用主体提供优质、高效的服务已经成为了当前的一个主流趋势。本文的研究对象H中心交易综合信息系统平台是A省全省统一的公共资源交易系统平台,并结合H中心的内部管理制度与业务流程,运用信息技术手段来不断加强对公共资源交易过程的规范性管理。虽然H中心交易综合信息系统平台能够满足基本的功能需求,但仍未完全达到建设之初的预期目标,仍存在着很多
行人再识别就是对两个或多个不存在交叉重叠监控区域的摄像头所拍摄的行人进行匹配,判断是否为相同行人。随着监控网络的普及,该技术结合目标检测、跟踪等技术可以应用到智能视频、智慧管理等领域。行人再识别成为一个热点课题,研究人员也提出了许多方法去解决各种问题,如摄像机视角、行人姿态、天气光照变化等。不同于传统的特征提取和度量学习的方法,本文通过深度卷积神经网络来研究行人再识别问题。本文为了提取具有分辨力和
“共享经济”时代的到来,作为企业信用发展的突破点,促进了整个社会信用体系的向前迈进。然而信用体系不断完善的同时,也伴随着一系列信用风险事件的频发,尤其是长生生物“假
高温超导变压器相较于传统变压器而言,具有体积小、重量轻、环保性能好、安全性高等优势,因此对高温超导变压器的研究成为了新兴电力设备研究的重点。论文针对一台容量为120kVA(6kV/400V)的单相高温超导变压器,对其绕组结构进行设计并展开电磁分析。论文第二章简单地设计了一台单相120kVA(6kV/400V)高温超导变压器的绕组结构。绕组使用的材料为第二代高温超导材料YBCO,高压绕组取8层圆筒结
随着电网规模扩大,异常用电频发造成的电力损失给电力公司带来巨大的经济损失,影响了电力公司的正常运营。由电力用户的窃电、欺诈等用户异常用电行为造成一系列无法用技术解释的损失称为非技术性损失(Non-Technical Loss,NTL)。NTL可能导致电力激增,电力系统负荷过重,电力公司巨额收入损失以及公共安全问题。传统NTL检测方法包括人工检查有问题的仪表及其配置,将异常仪表读数与正常仪表读数进行
随着现代化社会中电力技术的迅速发展,供电模式逐渐从单一的大型水电站、火电站、核电站等集中发电模式转变为以太阳能、风能、潮汐能等可再生能源为基础的分布式供电模式。为了能够将分布式发电模式与电网有机结合,相关专家提出了微电网的概念,它的提出有效地解决了分布式电源投入电网的问题。相较于交流微电网而言,直流微电网更适用于光伏电池、燃料储能电池、超级电容等直流微源的投入,并且具备损耗低、可控性强、效率高等优