论文部分内容阅读
本文对XML文档过滤技术进行了系统地研究:从一个大的XPath表达式集合中寻找与输入的XML文档匹配的XPath表达式子集的一些关键技术,包含XML文档索引、XPath查询索引、XPath查询索引的增量维护和文档过滤算法等。本文的主要研究成果有:采用对XML文档构造索引的方法,提出了一种新的XML文档索引结构,以增强对较大的XML文档和XPath查询中的祖先-后代关系“∥”的支持。针对路径表达式中存在的大量共享结构,我们介绍了一种基于共享前缀树的XPath查询索引结构,并对YFilter匹配算法进行改进,以解决XPath查询的结构匹配问题;同时,通过该索引结构可以很容易地对XPath查询进行增量维护,这对有效性和可扩展性要求较高的XML文档过滤系统来说无疑是非常重要的。提出了一种新的方法以支持对XPath查询谓词的匹配。将每个XPath查询分解为多个查询分支,并将所有XPath查询的查询分支构造成一个共享前缀树与输入的XML文档匹配,然后对匹配算法返回的结果进行处理以得出与XML文档匹配的所有XPath查询。