论文部分内容阅读
Internet的高速发展使得全球的数据、资源紧密的联系在一起,网络这个巨大的资源库包含着大量不同平台、不同格式的数据,如何对这些数据进行有效的数据交换、访问及查询等是急需解决的问题。XML是软件行业对这些问题提出的解决方案,随着XML的标准化和广泛应用,主流厂商已经将XML集成到包括数据库引擎、开发工具、浏览器和操作系统在内的各种产品中,大量围绕XML建立起来的基础技术也日益普及。 然而,由于XML的自描述特点以及层状嵌套结构,使其比另一些同类文档更大也更加复杂,而XML已经被广泛地作为一种数据交换的方法来使用,被交换的文档如果过大就会降低应用程序的性能和可扩展性。压缩技术是提高交换效率的一种方法,但接收方需要对压缩文档完全解压才能够执行进一步的操作,在很多应用中这种方式并不适用,这就提出了如何在高效压缩的同时在压缩后的XML文档上进行查询等操作的问题;另一方面,由于XML文档的层次结构的特殊性,传统的文件级别的访问控制已经不能适应在元素、属性的级别上进行访问控制的需要,所以对只需要访问部分XML文档内容的用户进行有效的数据访问控制也是XML数据访问控制面临的一个问题。 本文就如何有效的进行基于XML的数据交换提出了一个支持在压缩数据上查询的XML压缩方案,支持XPath查询(XPath-query-friendly),采用LZW与Huffman编码结合的方式在元素内容和属性值的粒度上进行压缩,并将XML文档的结构与数据分开单独进行压缩。论文描述了该方案的架构,设计的原则以及采用的主要技术,给出了与已有的压缩工具的压缩效果的比较。 在基于XML的数据访问控制方面,本文提出了一个利用用户、用户组数据和扩展后的XPath进行访问对象描述的XML数据访问控制方案,对该方案的架构,访问控制的主体、对象、授权规则和规则级别等进行了详细的介绍,并给出了应用示例。 最后,论文总结了完成的工作,并提出了方案中需要进一步研究的问题。