基于多维关联挖掘的诊疗辅助系统设计实现

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:anjiulo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子病历作为医院通过电子化方式记录患者就诊信息的诊疗记录,在医疗中作为主要的信息源,提供超越纸张病历的服务。随着医疗服务活动的开展,尤其是移动医疗设备与物联网技术在医疗领域广泛使用,各种健康数据日益积累,并且均呈现大数据量、异构分布的特性。这些数据结构复杂,彼此独立又相互关联性强。电子病历系统的环境通常是以单个医院为主体的本地系统,在构建个人健康档案时因为数据的弱语义性而利用困难。导致这种弱语义性的主要原因包括:不同电子病历系统间存在元数据异构;病例中包含大量非(半)结构化数据;诊疗系统相对封闭而知识共享困难。本文拟利用语义标注和外部开放关联数据融合的方式丰富电子病历系统中数据的语义信息,从而提升数据的机器可理解性和互操作性,并以此为基础进行进一步的关联挖掘和数据深层次利用。本文主要完成的工作包括:(1)设计了一种语义数据字典生成方法。本文首先针对诊疗数据的元数据自身的特点,设计了一种基于切词和关联单词替换的自动化的元数据语义标注方法,为诊疗数据的元数据生成包含丰富语义信息的数据字典。(2)设计了基于语义数据字典的医疗实例关联模型生成方法。本文针对电子病历系统中大量存在的诊断结果、用药信息、既往病史、症状信息等非(半)结构化的数据进行语义标注,并结合语义数据字典为每个实例抽取相应的医疗实例关联模型,将医疗数据与外部开放关联数据相融合。(3)建立了基于医疗实例关联模型的多维关联度计算模型。为了给本文研究提供实际的落脚点,本文利用前述研究提供的医疗实例关联模型,在包括但不局限于疾病类型的多维度上建立不同病例之间的关联关系,利用多维线性回归分析计算各维度在关联关系计算中占的权值。(4)基于多维关联度计算的诊疗辅助原型系统开发。最后,本文在上述三点研究的基础上设计实现基于关联挖掘的诊疗辅助系统,从大量的异构诊疗数据中查询目标病例的相似病例,为医护人员的诊疗方案制定工作提供决策支持。本文所提出的元数据和实例数据标注方法,在面对离散且异构的海量诊疗数据时既有较高的效率又能取得较好的准确率。利用生成的语义数据字典和医疗实例关联模型,离散在不同地域的不同医院的不同系统中的异构诊疗数据能够被有效的融合成为一个丰富的案例库。在此基础之上,经过权值优化的多维关联度计算模型能够更全面的挖掘不同病例之间的关系,从而对决策辅助提供更好的支持。
其他文献
传统民族服饰文化是几千年来祖先留给中华儿女的巨大财富。在数字化智能网络时代,传统民族服饰研究过程中积累的研究资料越来越多,存储与检索的需求巨大,传统民族服饰文化的传承和保护成为了亟待解决的问题。本文针对传统民族服饰研究对存储与检索的巨大需求,提出搭建分布式传统民族服饰图案存储平台,平台划分为存储层、平台层与应用层,各层的主要研究内容如下:(1)存储层采用Ceph分布式文件系统,设计并实现了传统民族
饲用作物能够为草食家畜提供优质的饲草料,从而为人们提供高品质的牛羊肉、奶制品,有着节粮、高效、健康的特质。国家正在推行种养一体化,将部分籽实玉米种植转变为青贮、全株利用,提高产能,进一步统筹粮经饲,大力发展饲用作物已是大势所趋。北方农牧交错带是我国旱作或雨养农业的主要分布区,饲用作物具有广阔的生态适应性,对季节性干旱也有一定抵抗能力;同时,土壤在多年生饲草覆盖下不易被侵蚀,在一定程度上饲用作物改善
从2012年开始我国引入行为保全开始到现在经历了漫长的修改进程。旧民事诉讼法中原先的“财产保全”和“先予执行”现改为“保全”和“先于执行”。行为保全的目的是为了更好的保障权利的实现,是一种临时性救济手段,在民事诉讼中具有重要的地位。中国的行为保全制度相比别的国家还比较单一,对此应深入研究别的国家行为保全制度并且与中国的行为保全相比较,发现其存在的问题并完善行为保全制度。笔者参考了大陆法系国家德国、
分布式声纳多目标被动定位系统,不仅需要处理目标信号级层面的数据,还需要对目标特征级层面的数据进行处理。本文针对目标特征级层面数据处理所遇到的问题,研究了多目标被动定位中的两个关键技术,即目标轨迹增强技术和目标关联技术。并且设计实现了分布式声纳多目标被动定位软件,该软件可实时监测显示目标的运动状态,有助于指挥员做出合理的指挥决策。在多目标被动定位过程中,弱目标容易受到强目标干扰,导致声纳输出的方位历
车牌识别技术在现代智能交通系统中发挥着重要作用。车牌定位与分割技术业已发展成熟,但这些常用算法在处理污染车牌时并不能取得良好效果。本文采集了大量车牌表面污浊、陈旧、破损等受到不同程度污染的车辆图像,建立污染车牌素材库,以此为数据样本重点研究污染车牌的定位与字符分割问题,以期提高污染车牌定位与分割的准确率。污染车牌与清洁车牌图像特征不同。首先通过对车牌灰度直方图和方差规律的分析,定义污染车牌的研究范
字理识字是指运用汉字特有的字音、字形、字义,利用汉字造字时所依据的规律进行识字教学。字理识字对于小学生识字意义重大。运用字理识字进行识字教学,能够帮助学生理解汉字、记忆汉字,能够进一步培养学生主动搜集资料习字识字以及运用汉字的能力。从小学生身心发展特点而言,这个阶段他们多以无意注意、机械记忆为主,注意持续时间短、理解记忆力弱,因此新课标要求这一阶段的教学要将传授知识与发展能力相结合,要使培养兴趣与
近年来,由于钠资源丰富、成本低以及与锂相似的化学/电化学特性,基于室温钠储存技术的钠离子储能器件引起了人们的广泛关注,是下一代低成本、大规模储能的重要发展方向之一。氟磷酸钒钠作为一种典型的钠超离子导体(NASICON)结构正极材料,具有工作电压高(>3.7 V)、理论容量大(128 mAh g-1)等优点,但是较低的电子导电率限制了其在实际中的应用。本论文通过与氧化石墨烯(GO)原位复合的策
跆拳道自2000年悉尼奥运会正式成为比赛项目后,全国各地都对此竞技项目进行了广泛的传播与发展,并且作为一项新流行的全民健身运动得到了不同年龄群众的喜爱,与此同时,不同水平的跆拳道竞技比赛也相继开展。跆拳道属于技能主导类对抗性项群,在此项群中,技战术的完美应用对比赛结果产生决定性作用。跆拳道技战术是不断运动与发展的,而规则则是技战术变化与发展的标准,大众跆拳道随着竞技跆拳道规则先后经历了五次大幅度修
Apache Spark作为专为大规模数据处理而设计的快速通用的计算引擎,具备运行速度快、更通用、内置更多应用工具等优点,是当前主流的大数据技术框架。Spark可以完整覆盖数据采集、数据清洗、数据分析以及数据展示等一系列数据研发流程。对于超大规模、商业级的大数据应用场景,当前的Spark生态仍然存着待改进提升的问题。首先,Spark缺少完善的针对业务作业的调度能力,作业调度需要全面考虑各种因素,如
合成孔径雷达(Synthetic Aperture Radar,SAR)既能够获取目标观测区域的高分辨率图像,又可以进行地面动目标检测(Ground Moving Target Indication,GMTI)。相比于机载SAR-GMTI系统,星载SAR-GMTI系统不受各国空域管制,能够获取更大的观测范围,在军事和民用上都发挥着重大的作用。但星载SAR-GMTI系统回波数据不易获取,工作环境更为