医疗云中隐私保护下关键词范围搜索研究

来源 :湖北工业大学 | 被引量 : 0次 | 上传用户:youjian_youjian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着医疗信息系统的发展,数字化和虚拟化正随着全球医疗产业的发展而形成一个整体的市场。对许多医院和医疗系统而言,通过医疗云来对电子病历进行统一的储存与管理能够解决日益增长EHRs的需求。尽管加密机制可以保证EHRs在半诚实云服务器中的机密性,然而EHRs数据经过加密后不再具有原有的特性,当医疗机构需要某些医疗数据时,无法直接在密文中分辨出所需要的数据,如何做到在大数据中既确保EHRs数据和病人隐私安全,又能对加密后的大量EHRs数据进行快速且精准的多关键词搜索是目前迫切需要解决的问题。可搜索加密就是近年来对此类问题的解决方案。尽管针对可搜索加密前人已经做了大量的研究[1-5],但是在搜索效率,模糊搜索这些问题上仍然存在着不足,本文通过对传统可搜索加密方案进行研究,针对于这两种不足提出了两种高效的可搜索加密方案,提高了已有的可搜索加密方案的效率以及灵活性。首先,以传统的安全KNN可搜索加密方案为基础提出一种支持多关键词范围搜索的可搜索加密方案。通过向量积保持加密机制实现支持复杂查询结构的可搜索加密方案,可支持连接关键词查询、范围查询以及通配符的查询;通过随机化构建搜索索引和搜索陷门,以实现搜索模式隐藏达到搜索语句的隐私保护;采用矩阵哈达马积替代原有的点积运算,缩小所需密钥矩阵的大小。最后,我们通过仿真实验与使用传统KNN的方案的两个方案进行了性能对比,实验结果表明我们的方案能够显著减小初始化,生成索引以及搜索陷门的时间。随后,在由哈达码矩阵构建的安全KNN可搜索加密方案的基础上,为了实现有效的模糊搜索,提出了一种云计算中隐私保护的多关键词模糊可搜索加密方案。通过Word2Vec构建词向量,实现了关键词间的语义相似评估;通过谷本系数计算词向量间的相关系数分数以及逆文档频率计算文本间的相关度,实现了更准确的文档匹配。最后,通过仿真实验证明了当划分段数越接近(?)时,初始化,索引以及搜索陷门构建时间越短,同时评估了几种不同的构建词向量方式的准确性。
其他文献
给定某并发程序执行轨迹,基于约束求解的并发测试方法将并发错误模式和执行轨迹的可行性要求转化为一组约束条件,通过约束求解生成暴露并发错误的并发执行交织。该方法具有无误报、低漏报率等诸多优势。并发程序在开发过程中会经历多次修改,产生多个程序版本。在并发程序的演化过程中,直接对各个版本的基于约束求解的并发程序测试,由于未有效利用版本变化信息,而造成重复测试,致使并发程序回归测试面临效率较低等问题。为了提
徐青甫是民国时期江浙士绅代表之一,他多次担任浙江省政府要职,也曾代理主持浙政。他的经济学著作丰富,其经济学思想主要体现在《经济革命救国论》、《物价问题之研究》和《
随着通信技术和半导体技术的发展,信息的传递越来越便捷,现代通信使人与人之间的联系十分紧密,万物互联互通成为了“物联网”的发展目标。窄带物联网是一种发展迅速的物联网协议,可以在LTE网络上升级和部署,对射频收发机和频率合成器提出了更高的要求。在先进工艺条件下,宽带全数字锁相环更适合于物联网应用场景。数控振荡器作为全数字锁相环频率合成器的核心模块,对整个系统的性能具有重要影响。因此宽带高精度数控振荡器
作为人工智能的核心算法之一,神经网络对训练速度、准确度、架构复用性的要求越来越高。目前训练一个中型规模的多层神经网络需要亿量级计算量。传统架构并行度低、复用性差、扩展能力弱等局限性已经不能满足神经网络在并行计算中的需求。因此,本文对基于流式分布式架构的神经网络进行研究,以满足训练速度提升、架构复用和计算能力扩展的需求。本文首先提出了一种基于Storm流式分布式架构的神经网络训练模型NN-S(Neu
改革开放以来,我国制造业发展迅速,建立起了完整的产业布局体系,推动了城市现代化发展和区域经济空间优化布局,尤其是在重塑城市经济空间结构方面。伴随着劳动力、资源利用和
随着无线通信技术的不断发展、智能终端的不断普及和室内基于位置服务(Location Based Service,LBS)的业务需求的不断增长,近年来室内无线定位技术受到越来越广泛的研究。基于无线局域网(Wireless Local Area Network,WLAN)的室内定位技术得益于成本低、覆盖范围广、便携性等优势成为了室内无线定位的研究热点。本文研究了不同的室内定位技术和室内定位系统,分析了
微博作为热门的社交媒体之一,具有及时性、便捷性、交互性以及用户使用体量巨大等特点。这些特性不仅使得监管的难度增加,也造成微博平台中充斥着虚假、消极、负面言论。因此,社交媒体舆情分析系统的研发显得尤为迫切。本文研究工作主要包括以下内容:1)社交媒体微博数据采集及预处理。本文以新浪微博中有关“7.5杭州女子失踪案”的数据作为研究对象,采用网络爬虫技术并按照不同策略获取数据,实现数据的采集。同时,对获取
以YBa2Cu3O7-δ(YBCO)为代表的第二代高温超导带材具有优异的电学性能,在电力传输、电能存储、强磁场等领域有着非常广阔的应用前景。本研究基于离子束辅助沉积(IBAD)技术和金属
会议
作为数据挖掘领域的主要研究对象,关联规则挖掘能够发现关系数据集中数据项之间有趣的关联信息,而关联规则挖掘工作的主要开销是来自频繁项集挖掘。然而,传统的频繁项集挖掘算法的效率并不高,并且伴随着计算机软硬件性能的提升,基于并行计算的数据挖掘技术开始成为学术界的研究热点。因此,本文主要研究如何基于传统的串行挖掘算法进行改进以及如何利用并行化技术来提升频繁项集挖掘算法的性能。实际应用中,事务数据集并不一定
近年来,大量第三方在线旅游平台的出现极大得便利了人们的出行需求,用户足不出户便可轻松预定到酒店、机票等旅行产品。在传统情况下,用户通过直接渠道从平台购买产品,在该渠道下,用户能够查看到平台上各个供应商的产品信息以及产品价格,然后根据这些信息及用户自身对不同产品的偏好来做出购买决策。而近年来,国外许多在线旅游平台又开创了不透明渠道,在该渠道下,平台会隐藏产品的部分信息,用户需要在产品部分信息不确定的