基于粒计算Web文档聚类

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:weiwei00414
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于粒计算Web文档聚类(WDCGrc)方法。该方法通过TF—IDF法则计算文档词条的权值,采取设定文档阈值和平均权值相结合的方法实行降维,抽取出每篇文档的主干词;建立了文档的主干词和二进制粒之间的转换,提出了基于粒计算提取文档间的关联规则算法来获取文档间的频繁项集,由频繁项集形成初始聚类,使用优化算法对初始聚类进行优化,得到最终聚类结果。实验结果表明,该方法切实有效,聚类质量较好。
其他文献
将移动业务分成不同的QoS等级,并在3G网络边缘根据网络资源的动态变化对业务的QoS等级进行自适应调整。给出了具体的实现算法并通过仿真证明了算法的有效性,即可有效降低丢失率
借鉴生物免疫原理中克隆选择机理,设计了一种基于记忆克隆选择的多目标免疫算法。该算法构建了一种亲和度的快速计算方法,并在抗体种群全局搜索Pareto解的同时,也在记忆单元进行
使用聚类技术对BNR进行扩展,得到一个新的4层模型,该模型同时使用了术语间和文档间的相近和相似关系,将此扩展模型和简单的RNR、扩展的BNRM模型比较,实验证实信息检索系统的检准
分析了东盟文献资源信息化建设的重要性、主要内容及存在问题,提出东盟文献信息化建设的建议。
在P2P点播系统中,如何快速发现合作节点这一资源定位问题是一个挑战。特别在用户进行VCR操作时,这一问题更显突出。播放点的随节点播放而连续前移和用户VCR操作造成的节点跳