论文部分内容阅读
本文对XML文档的安全发布过程中的关键技术进行了研究。
首先为了形式化表示XML文档中的公共知识,本文提出了一种基于值等的XML函数依赖的定义。该定义通过关联节点集的概念,定义各类型节点之间的函数依赖关系。又因XML文档中存在许多并非完全成立的函数依赖,即近似XML函数依赖,本文利用XML函数依赖元组的概念给出了XML近似函数依赖的定义,并提出了支持度和置信度作为衡量一个近似XML函数依赖的指标。此外,本文提出了一组算法,可以自动抽取XML文档中所有支持度不小于最小支持度、置信度不小于最小置信度的近似XML函数依赖。
其次,基于XML函数依赖,本文提出了支持XML文档的安全发布算法。首先研究了利用函数依赖进行推导的各种可能性,发现无论如何应用约束进行推导,总能求解出一个唯一的、最大的推导文档包含所有可能得到的推导文档。通过验证该最大推导文档,可以发现部分文档是否存在信息泄露,以及存在多少信息泄露。最后基于与或图,设计了计算消除信息泄露的安全文档的算法。同时本文通过实验分析了信息泄露问题,并验证了所提出算法的正确性和有效性。
基于提出的算法,本文设计并实现了一个发布XML文档的软件——XGuard。数据拥有者通过XGuard可以方便地在XML文档中定义敏感信息。XGuard通过XML文档中的函数依赖,验证去除敏感信息的部分文档是否存在信息泄露,并帮助数据拥有者计算一个防止信息泄露的安全文档。