【摘 要】
:
XML作为一种Web上通用的数据表示和交换格式,在互联网高速发展的今天得到了越来越多的应用。与HTML相比,XML具有更大的灵活性。它不仅可以用来标记无结构的文本信息,还可以标记
论文部分内容阅读
XML作为一种Web上通用的数据表示和交换格式,在互联网高速发展的今天得到了越来越多的应用。与HTML相比,XML具有更大的灵活性。它不仅可以用来标记无结构的文本信息,还可以标记高度结构化的规则数据(如数据库中的数据)。但同时,这种灵活性也给XML的查询处理带来了新的问题。随着Web上XML数据的快速增长,如何帮助用户快速有效地检索大量的XML数据,得到想要的信息,便成为亟待解决的课题。
一般来说,文档聚类是一种帮助人们检索信息的有效手段。与普通文本文档相比,XML具有自描述性、半结构化、层次性等特点,本身带有一定的结构和语义信息,这些特点更使得XML文档聚类成为了检索XML文档信息的有效手段。
事实上,国内外对此已做过不少研究,本文在以前学者研究的基础上提出了一种新的基于遗传算法进行XML文档聚类的方法。首先,遗传算法可以用于聚类操作并能取得良好效果,已经得到证明,但如何将该算法的思想应用到XML文档聚类中还没有相关研究。本文针对XML文档可以表示成文档结构树这一特性,提出了一种新的基于树的层次结构的二进制位图索引编码方案,并相应建立了一系列有助于遗传操作(选择、交叉、变异)的位图运算。其次,XML文档聚类的关键点是文档间相似性的度量,本文在综合考虑了XML文档树层次、深度这些特性的基础上,将其与遗传算法交叉算子、变异算子的设置相结合,提出了一种新的基于遗传算法的XML聚类算法。最后,在研究遗传算法的变异过程时,本文针对XML特性提出了一种动态选择变异位置的策略,从而有助于算法更快地寻找到全局最优解或准最优解。
最后,本文从实践的角度通过实验对比分析,验证了算法的可行性和高效性。
其他文献
随着移动通信技术的飞速发展,相关法律法规的制定、实施,市场规范的完善,以及人们对使用手机听音乐、看电影、看电视等多媒体业务的需求越来越突出,移动运营商从原来仅提供单
碰撞检测是计算机动画,物理仿真,计算几何,机器人学,计算机游戏等领域的重要课题,在虚拟环境中,碰撞检测是动态物体与静态物体之间或者动态物体与动态物体之间的交互基础。因此,快速
当今社会,随着人们生活水平的提高,生活节奏的加快,人们的消费观念也逐渐发生着变化。在购买商品时,消费者不仅关注商品的实用性,而且越来越重视商品的外观与造型的艺术性。
随着网络应用的迅猛发展,VoIP技术得到了广泛应用。但是,为解决IP地址不足以及网络安全问题而提出的网络地址翻译(NAT)技术和防火墙技术却导致了VoIP的端到端通信问题。如何
随着软件的应用领域越来越广,人们对软件质量的要求也越来越高。面向对象软件技术也已经得到广泛应用,面向对象软件度量也就更重要起来。而且,如果在软件开发的初级阶段能够
学生选课系统是典型的信息管理系统,本系统是根据现代化校园的发展而设计的基于ASP.NET的学生选课管理系统,众所周知,高校的信息化在现代教学中作用越越大,教学的方方面面都离不
在当前,计算机网络正处于一个革新的时期,网络的的基本架构自从提出之后,多年来并未发生本质改变。而另一方面互联网的飞速发展使得其对网络的需求越来越高,这导致了传统网络架构
生物特征作为人类个体的内在属性,具有很强的个体独立性和区别差异性。因此,如何有效地将个人的生物特征应用于计算机智能信息处理应用领域吸引了广大研究学者们的浓厚兴趣,
随着公共安全问题的发生日益频繁,大规模人群疏散问题成为应急处理中不容忽视的重要环节。研究突发事件下人群疏散的行为特征及运动规律,对人群聚集场所的疏散能力进行风险评估
人脸识别技术是基于生物特征的识别方式,与指纹识别等传统的识别方式相比,具有实时、准确和非侵扰等特性,较容易被用户接受,因此人脸识别技术在诸多领域都有广泛的应用。人脸