基于XPath查询的XML文档过滤

来源 :复旦大学 | 被引量 : 0次 | 上传用户:zjkghost10
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对XML文档过滤技术进行了系统地研究:从一个大的XPath表达式集合中寻找与输入的XML文档匹配的XPath表达式子集的一些关键技术,包含XML文档索引、XPath查询索引、XPath查询索引的增量维护和文档过滤算法等。本文的主要研究成果有:采用对XML文档构造索引的方法,提出了一种新的XML文档索引结构,以增强对较大的XML文档和XPath查询中的祖先-后代关系“∥”的支持。针对路径表达式中存在的大量共享结构,我们介绍了一种基于共享前缀树的XPath查询索引结构,并对YFilter匹配算法进行改进,以解决XPath查询的结构匹配问题;同时,通过该索引结构可以很容易地对XPath查询进行增量维护,这对有效性和可扩展性要求较高的XML文档过滤系统来说无疑是非常重要的。提出了一种新的方法以支持对XPath查询谓词的匹配。将每个XPath查询分解为多个查询分支,并将所有XPath查询的查询分支构造成一个共享前缀树与输入的XML文档匹配,然后对匹配算法返回的结果进行处理以得出与XML文档匹配的所有XPath查询。
其他文献
本文分析比较了IPv4和IPv6两种协议的异同点,介绍了IPv6新协议的特点及一些技术规范。并着重研究从IPv4向IPv6过渡的问题。重点分析了目前几种比较成熟的技术:双协议栈技术、隧
RoboCup仿真2D比赛过程需要球队间的整体高效的合作及多个智能体之间默契配合,如阵型策略的调节,才能赢得比赛胜利。但由于通讯的限制,智能体很难在动态实时的比赛环境中得到足
对地球上各种自然现象和景物的虚拟仿真早已经成为计算机仿真领域的热点和难点,海洋占据地球总表面积的70%以上,人类在海洋中从事着各种各样的经济及军事活动,是人类活动的重要
数据挖掘是指从大型数据库或数据仓库中提取隐含的、先前未知的、对决策有潜在价值的知识和规则。它是人工智能和数据库发展相结合的产物,是目前国际上数据库和信息决策系统
数据压缩技术已成为当今通信、广播、存储和多媒体娱乐等领域的一项必不可少的关键技术。但在安全、医药等几个特殊领域,由于对图像数据要求苛刻,压缩、解压缩过程不能有丝毫
藏文字处理是计算机完成藏字的输入、处理和输出的全过程,是研究藏文信息的技术基础。目前,国内外虽有几个藏文字处理系统,但还没有一个可以输入所有藏字的系统。本论文旨在研究
本文详细介绍了国际上目前在这三个步骤上提出的多种算法,并针对这三个步骤提出了自己的改进算法。文中一共提出了六种改进算法,包括塌缩步骤中的关键顶点塌缩算法和顶点团
根据单片微机系统的发展趋势及用户对驱动器测控系统的需求,在对系统功能,技术指标、性价比等方面进行了可行性分析之后,提出了一套能够满足用户要求的系统设计方案。本文针对系
多媒体技术的发展使人类获取、处理信息的手段发生了质的飞跃,人机交互的方式越来越便捷、有效、人性化。多通道信息融合的研究正是适应人机交互这一要求提出来的,而对人类交流
不同汉字字体都有其视觉差异,这种视觉差异要比不同字符之间的差异小得多,小波分析要比Gabor变换更加符合研究信号不同位置局部性质的要求,小波变换能够在不同的分辨率下对信