PBC:一种基于路径的XML文档聚类方法

来源 :应用科学学报 | 被引量 : 0次 | 上传用户:seraphim0113
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于路径的XML文档结构聚类方法(PBC).与其他方法直接计算XML文档结构距离不同,该方法通过对文档包含的路径聚类,间接完成文档的聚类.首先,包含某一路径的文档集合形成初始类,并用该路径作为初始类的标识.然后,用层次聚类方法根据设定的标准,合并初始类,直至结束.类的标识信息是类中文档包含的路径,结果直观,容易理解.算法的复杂度是O(n),其中n是文档的大小.相关实验证明该算法不但能保证聚类结果准确,而且能大幅度提高计算的速度.
其他文献
针对经典粗糙集理论中的不可分辨关系对连续属性值中噪声数据缺乏容错性的情况,提出一种基于个体属性值距离的相近关系,定义了相近关系下的粗糙集理论的基本概念.在相近关系
制备了添加少量B2O3和P2O5后的Fe2O3-CaO-SiO2体系铁磁微晶玻璃,并进行了微观结构分析、XRD分析、磁性检测以及生理模拟液的浸泡实验.实验结果表明,制备的微晶玻璃材料同时具
传统的AHP方法解决多准则决策系统有着独特的优势,但对于有些非常复杂的决策系统运用AHP进行分析后,在求解过程中,或者判断矩阵求解比较困难,或者求得的判断矩阵不能够通过一
以液压挖掘机工作装置为例,提出了实现结构动静态优化设计的技术路线,并给出了实现有限元分析参数化建模、协同优化建模和协同优化的方法和策略.通过应用分布式协同优化和结
利用用户查询结构和属性结构的稳定性特征提出了一个事务级用户查询模式挖掘算法,该方法应用在数据库入侵检测系统中,可以有效地防止SQL注入、合法用户权限滥用等非法行为,并