基于医疗知识图谱的辅助诊断系统研究与应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:fado
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国社会的蓬勃发展,网络基础设施建设逐渐完善,人们可以更加轻松地通过电脑、手机等个人设备接入互联网,享受信息化浪潮给我们生活带来的各种便利。人们在医疗健康问题上需要帮助的时候,除了去医院看医生,听从医生的建议,现在还可以利用互联网上近乎海量的医疗知识,来完成自我诊断。但是,互联网上这些丰富的信息在方便人们的同时,也带来了信息过载的问题。人们在搜索某个疾病相关信息时,搜索引擎往往会根据关键字返回近千万条不同的搜索结果。人们需要在这么多搜索结果中去挨个搜寻自己真正需要的信息。这对于大部分人都是不小的负担。针对以上的这种问题,本文尝试构建一个基于知识图谱的医疗问答系统来帮助用户进行辅助诊断。不同于搜索引擎直接返回关键字的搜索结果,医疗问答系统对于用户的问题,会进一步分析,然后只返回最贴近用户搜索意图的一个答案。对于用户来说,省却了繁杂的信息筛选工作,降低了医疗信息的获取难度。本文的主要工作包含4个部分:(1)提出了一个基于医疗知识图谱的辅助诊断系统的整体结构,将系统整体分成了六个主要模块:知识图谱构建模块、命名实体识别模块、实体链指模块、意图识别模块、答案查询模块和答案构建与展示模块。(2)知识图谱模块,首先对于医疗健康网站的疾病百科数据进行爬取,然后构建出了一个包含实体约4万个、实体关系约20万条的医疗知识图谱。(3)对于医疗命名实体识别模块,本文提出的基于BERT的多层级卷积CRF网络,综合F1值达到0.886,显著超过基线模型;对于实体链指模块,本文设计出了高效的算法将相近表述的实体链指到知识图谱实体上;对于医疗意图识别模块,本文提出的基于BERT的意图分类模型准确率达到了92.83%,比基础的Text CNN提升了3.71%。(4)最后使用Flask轻量级开发框架,把系统的各个模块整合到一起,添加了易于使用的用户界面,完成了整个基于医疗知识图谱的辅助诊断系统的构建工作。本文旨在解决当前人们在医疗健康领域遇到的搜索信息难以筛选的问题,并通过深度学习模型和自然语言处理方法提升整个辅助诊断系统的问句语义理解能力,最终构建了一个简洁易用的辅助诊断系统。
其他文献
当前,智能医疗领域由于其旺盛的需求及庞大的发展潜力,成为了人工智能技术重点研发和应用的方向。本文拟针对三维膝关节核磁共振图像中前叉韧带疾病的诊断进行研究,算法框架包括一个前叉韧带病灶区域检测模块,以及一个前叉韧带撕裂程度病理分级模块。在病灶检测模块中,本文建立了以三维卷积核为基础的卷积神经网络,对三维图像中的空间特征和结构特征进行了充分提取;考虑到医疗图像中病灶点尺寸较为固定,因此在训练网络之前先
在云计算不断发展中,软件服务化趋势越加明显,用户通过网络即可使用应用提供的服务,服务慢慢变成应用构建基础,成为云产品的基本形态。FaaS(Function as a Service)以函数为单元提供服务,符合云发展的趋势,并且作为一种新型计算方式成为了云计算未来发展的一个方向。FaaS的出现使用户专心于编写和上传核心的业务代码,由FaaS负责创建和维护相应的计算、存储、网络等资源。用户完成编写并上
根据某篇目标论文寻找相似论文,是科研人员的常见需求,学术论文推荐系统能够帮助科研人员从快速增加的海量学术大数据中过滤提取有效信息。推荐算法是推荐系统的主要研究对象之一,不同的推荐算法适用于不同的数据。学术论文包含多属性特征,既可以使用基于文本特征的推荐算法,也可以根据引文、共引等信息构建同构网络、根据文章、作者、机构等信息构建异构网络,对网络使用基于图特征的推荐算法。现有的论文推荐方法存在许多问题
近年来,随着经济、科技、医疗等的快速发展,在世界范围内,人口数量持续上升。每逢节假日,在旅游景点、购物商场、交通枢纽等公共场所均会出现大量人群聚集的情况,一旦发生异常情况,极容易发生踩踏事故,导致人员伤亡。如果能使用架设在公共场所的监控设备进行实时的人数检测和预警,便能够有效地避免事故的发生。这使得使用监控摄像头进行人群计数成为计算机视觉领域的一个研究热点。此外,人群计数还有更多广泛的应用,例如公
无人机作为一种利用无线电方式控制指挥的无人设备,其控制准确性极大依赖于通信信号的强弱,在复杂场景下容易出现指挥控制困难、设备不兼容、数据传输容易被干扰等情况。因此,需要寻找一种更高效、兼容性更好、更安全的人机交互方法。随着深度学习的发展,出现越来越多的算法来解决在人机交互领域的动作识别问题。但多数方法采用图像+光流的形式进行联合训练,计算成本巨大,且容易受到浅层视觉特征的影响。本文基于姿态检测算法
井间电磁探测是在单井基础上发展起来的一种低频远探测方式,发射端采用磁偶极子源以一定的频率发射电磁波信号,并在相距一百甚至几百米的接收端,对信号进行接收和采集。井间电磁成像是根据接收端获取信号波形的幅度和相位等信息,通过反演迭代得到井间地层电阻率的分布。本文利用积分方程数值模拟的方法对地层电阻率分布进行建模分析,得到井间电磁场响应。然后对各个接收点电磁信号分析研究,分析电阻率变化以及电阻率对比度对电
目前语音识别技术中运用较成熟的高斯混合-隐马尔科夫模型(Gauss MixedModel and Hidden Markov Model,GMM-HMM),其结构简单,实现方便,小数据下训练速度较快。但随着语料库的增大,及语音识别精度的要求变高,GMM-HMM难以穷举所有的文字关系,导致其对数据的适应性差,识别效果不够好,且传统模型使用解析语音的音素信号序列与对应文字进行训练,需对齐语料语音与文字
遥感全天候地表温度产品因不受云雾覆盖影响、长时间序列等优点被广泛应用于气候变化、灾害防控等研究,在青藏高原冰川地区等多云雾地区具有很高的应用潜力和价值。然而目前遥感全天候地表温度产品的空间分辨率多为1 km中空间分辨率,在诸如冰川泥石流等较为精细化的灾害监测中面临空间分辨率不足的问题,进而影响了地表温度的进一步应用。为了提高遥感全天候地表温度产品在青藏高原冰川地区的空间分辨率,本文开展的主要研究工
地表温度(Land Surface Temperature,LST)是地气界面能量交互中的一个关键因子,是地表热辐射的直接表征和多种地气模型的输入参数。热红外遥感是反演地表温度的主流方式,但是受制于物理机制的影响仅能获取晴空条件下的地表温度。被动微波遥感在监测大区域尺度地表温度变化、补足由于云覆盖导致的地表温度时间序列缺失以及协同热红外遥感生成中分辨率(如1 km)全天候地表温度等研究中有着得天独
算法、数据和算力等的进步使今天的目标检测技术在公开数据集上检测效果远超人类。但是算法在落地时,应用场景的数据(目标域)与训练该算法的数据(源域)可能因成像、光照、天气等条件不一致,在图像特征分布上出现较大差异,即领域偏移。领域偏移导致目标检测算法在实际应用时漏检误检增多,效果远不如在公开数据集上的表现。目前解决领域偏移问题主要有两种方案:一是把目标域图像进行标注后重新有监督地训练检测模型,直接得到