论文部分内容阅读
医学是一门与我们每个人的健康息息相关的学科,所以研究者总会把最新的科研成果应用在医学领域里,医学信息化就是其中的一部分。病历是对医学理论知识进行实践的记录,是一笔宝贵的财富。从文本病历中自动提取关键信息对临床诊断和医学理论的进一步学习都有重要的意义,是目前医学信息化迫切需要的技术。本文从这一需求出发,设计了文本病历提取系统。本文在研究了大量文本病历,与医学领域专家进行充分沟通的基础上,分析了病历信息的内容和结构特点。对病历信息进行了分类,设计了提取方案。结合HL7信息参考模型,提出了诊察信息五元组的定义及诊察信息提取模式的自动获取方法并设计了语义类。为了对大量信息进行提取,还对提取模式进行了语法(二元关系泛化)泛化和语义泛化。最后,从系统的流程出发,分析设计了系统总体框架和七大模块,并对各个模块的功能和实现方法进行了详细介绍。通过测试发现系统运行良好,满足功能要求,提取项的准确率和召回率也取得了较好的结果。