论文部分内容阅读
随着信息技术的迅猛发展,可扩展标记语言XML凭借它良好的可扩展性、自我描述性、文档结构化以及与传输协议无关的优势迅速成为网络上数据传输的主要载体,被广泛地应用于各种领域,尤其是经济、金融和医疗等。在网络环境中,越来越多的包含个人信息的数据采用XML来表示与管理,XML隐私信息面临很大的威胁。所以,如何保护XML隐私数据和防止敏感信息泄露,同时保证信息的合法使用成为当前面临的巨大挑战。 XML标准推出后不久,W3C就提出了一系列的安全信息表示标准,包括XML加密、XML数字签名、XML访问控制等等。另外,大量关系型数据库的安全防范与隐私保护机制被改造并运用于XML数据库中。但是,XML的半结构化特征、Web环境中应用系统的多样性与复杂性都对XML数据库的隐私保护提出了更高的要求。 本文在研究了传统的隐私保护技术和XML相关技术基础上,针对XML隐私保护中存在访问控制策略定义复杂、疏于对敏感信息的保护、存在隐私位置泄露及信息量大小泄露等问题,提出了一种结构和内容相分离的XML隐私保护思想,并基于此对XML隐私保护的若干关键问题展开了系统深入的研究。首先,提出了一种基于同心圆切割的XML区间编码方案,能快速判断任意两节点间的关系,提高查询处理中的执行效率;其次,提出了一种基于下三角矩阵的XML安全访问模型,借助于下三角阵的特征,既方便了XML结构和内容的组合,又满足了XML隐私保护的安全需求;再者,提出了一种基于多项式的XML用户认证和授权方案,该方案把用户的授权多项式和全局结构树相结合生成临时访问视图,由于临时视图无需存储,这样不仅节省了存储空间,也保护了XML数据;最后,面向云存储的隐私保护需求,提出了基于可信第三方的XML云存储安全保护方案,该方案以乱序的方式将XML核心信息存储于云端,同时在云端还实现了签名保护机制。具体来说,主要研究成果及创新点包括以下几个方面: 1.提出了基于同心圆切割的XML区间编码方案。XML文档的数据编码是XML数据处理领域中最基本的预处理步骤,因此它在XML数据处理中起着举足轻重的作用。该方案把一棵n层的XML树想象成是n个不同半径的同心圆组成,其中圆心代表根节点,基于兄弟节点等分切割给定区域的思想,采用圆的半径和角度范围进行标识的编码方法,完成了对XML文档的标注。该方案能迅速判断XML文档中任意两节点间的关系,可用于XML数据查询处理中。 2.针对XML的半结构特征,提出了结构和内容相分离的XML隐私保护思想。XML文档中的数据表示不仅需要结构特征(称之为XML结构),而且也需要内容特征(称之为XML内容)。如果把结构和内容相分离,那么对于入侵者而言,获取了结构而缺少内容,或者获取了内容而缺少结构都无法得到完整且正确的信息。基于这一结构和内容相分离的思想,提出了一种用下三角矩阵来表示XML访问视图的方法。该方法巧妙地利用起止区间编码来完成对XML文档及压缩结构的XML结构图的编码,利用压缩结构图和节点编码之间的关系,建立起带有访问控制视图功能的下三角矩阵。此方案不仅有效地节省了存储空间,而且提高了查询时间。 3.针对XML文档的认证和授权问题,提出了基于多项式的XML用户认证和授权保护方案。在该方案中,首先把XML结构树中代表叶节点内容的编码依次作为多项式系数,建立起全局授权多项式;然后系统根据用户的访问目的及隐私保护过滤规则对全局授权多项式进行剪裁,生成用户各自的授权多项式。此授权多项式一方面反映其访问授权,另一方面被用于验证用户身份。最后临时访问控制矩阵的生成,为用户查询提供了方便,而且其临时性不仅增加了信息的安全性,而且也节省了系统的空间存储。 4.针对云背景下XML数据隐私保护问题,提出了基于可信第三方的云存储保护方案,借助于可信第三方来存储XML结构信息,主要的内容信息则以无序扰乱的形式存储于云端,同时云端也加入了签名保护机制。在该方案中,建立了针对XML的隐私保护模型,描述了隐私过滤的过程,最终软件模拟了这一个模型,实现了具有隐私过滤功能的XML信息保护。