面向医疗大数据的数据安全存储与检索系统研究与设计

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:WYH5198
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生活水平提高,人们对于身体健康的关注度日渐上升。当前,出现了许多基于智能系统的移动可穿戴式医疗设备,可采集人体的血压、血氧、心电、血糖、体脂等多种类型的医疗数据并上传存储于后台服务器。面对海量的多类型医疗数据,一种传统的方法是搭建分布式平台Hadoop并在HDFS上直接存储文件,检索时首先通过RPC协议访问NameNode获取文件的元信息和DataNode地址,然后依据元信息判断是否是检索文件,最后根据地址依次读取相应的多个DataNode上文件数据并返回。这种方法的缺陷包括:检索时做了许多无效文件匹配工作;每次都远程访问NameNode,产生多余的数据交互传输和可能出现的时间延迟;直接存储明文文件,造成服务器一旦遭到网络入侵,医疗数据信息将会泄露的安全隐患。鉴于此,本文设计了一种新的数据存储模型,该模型包括:存储数据时,对多种类型的医疗数据进行分类,把分类信息写入到JSON配置文件中,在检索时省去多余的文件匹配操作;成功完成一次检索作业后,将检索条件与返回文件的DataNode地址存入一个内存Hash表中并在文件发生变化时更新表的信息,以此避免频繁的远程交互并提高检索速度;借鉴了当前密码学中关于密文检索的最新成果,对称可搜索加密算法,应用在本数据存储模型中以加强医疗数据在服务器端的安全性。基于上述的数据存储模型,本文设计并实现了一套面向医疗大数据的安全存储和检索系统。该系统包括四个模块:数据分类模块、数据安全模块、数据存储模块、数据检索模块。在数据分类模块中,首先将上传到服务器的多种类型的海量医疗数据,依据相关的条件进行分类存放在HDFS上的不同位置,这里的条件是以后将要检索的关键词信息,比如医疗数据的类型;在数据安全模块中,通过两层手段确保医疗数据的安全性。第一层是访问控制层,通过对文件检索访问的账号进行认证,从而分配相应的读写、执行权限,防止违规操作和越权行为造成的危险。第二层是数据加密层,使用对称的可搜索加密算法,在上传文件前对文件和检索条件使用密钥进行加密,保证了即使在服务器端也无法查看医疗数据文件的内容;在数据存储模块中,使用了 HDFS分布式文件系统,它有着高可靠性和高容错性,其分布式存储的方式保证了医疗数据存在多个副本,不会轻易丢失;在数据检索模块中,在内存中维护了一个Hash表,当完成一次成功的条件检索后,会将条件和返回文件的DataNode地址串置入该Hash表中。这四个模块每一个只完成单一职责,降低了各模块间的耦合性,提高了系统的扩展性。实现了系统之后,从采用的加密算法方面来评估系统的安全性;分别在该系统和HDFS上存储大量的多类型医疗数据,并进行多次检索作业。从检索作业消耗的时间上看出,此系统具有较高的检索效率。在文章最后,我们对工作进行总结,阐述了本课题所做的成果,并指出系统存在的不足之处,对海量医疗数据存储检索模型的发展进行展望。
其他文献
目的比较丹参酮ⅡA与丹参酮ⅡA磺酸钠对人肝癌HepG2细胞的体外增殖抑制作用。方法采用改良MTT法测定丹参酮ⅡA与丹参酮ⅡA磺酸钠对HepG2的增殖抑制作用,倒置显微镜下观察两者
公共体育场馆是人民进行健身活动的场所和竞技体育训练及比赛的基地,是我国体育事业的重要组成部分。第五次全国体育场地普查情况表明:我国的公共体育场馆18481个,占总体育场
真空冷却是一种快速、清洁的食品冷却技术,已经被广泛地应用于蔬菜、水果、焙烤食品、黏性食品、海鲜、小块熟肉以及切花的冷处理。然而,与传统的冷却方式(例如风冷和水冷等)
农村信用社是支持农村经济发展的重要金融机构。从筹建设立时起,农村信用社一直肩负着支持三农发展的重要任务,经过多年的发展,现在农村信用社已经成为农村金融市场最主要的
本文综述菜豆采后外观品质下降、呼吸跃变、细胞膜透性增大、营养品质下降等生理变化,介绍影响菜豆贮藏效果的品种、成熟度、营养条件、贮藏条件、理化处理、包装材料等内、
大学制度创新显然不是指对现实的大学制度进行修补或完善,而是应该创立一种新的、与过去完全不同的大学制度。这种大学制度可能与现行的制度有联系,可能继承了现行制度中的许
技术分析方法由来已久,其原理和使用在国内外却一直引起诸多争议。本文从实证的角度出发首先根据随机游走理论对目前我国期货市场上四种代表性商品期货的价格时间序列进行了自
目的总结上肢深静脉血栓形成(UEDVT)的临床诊治体会。方法 11例UEDVT患者均经彩色多普勒超声检查或CT静脉造影确诊,予低分子肝素和华法林治疗,维持国际标准化比值在2.0~3.0。