基于蚁群算法与K-means算法相结合的Web用户聚类

来源 :情报学报 | 被引量 : 0次 | 上传用户:dzf2006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web用户聚类是指用聚类算法产生用户会话的聚类,是电子商务中的一个重要问题。该问题的难度在于有成千上万的会话需要聚类,而且每个会话都可描述为一个高维向量。此外,该问题就聚类的数目而言具有指数的复杂性,是一个NP-难的问题。本文提出一种新的聚类方法,该方法将蚁群算法与K-means算法相结合对用户会话进行优化聚类。实验结果表明,与K—means算法相比,该方法在Web导航推荐的应用中具有更好的性能。
其他文献
本文阐述了中文叙词表本体(OntoThesaurus,即基于中文叙词表建立的本体知识库)共建共享系统的设计思想和总体结构。描述了中文叙词表转换为OWL本体的扩展TBox定义,叙词表文本的AB
Web自动文本分类是信息检索与数据挖掘领域的研究热点与核心技术,近年来得到了广泛的关注和快速的发展。本文首先分析了国内外Web自动文本分类方法的研究现状,接着对新近出现
借助特征聚类进行特征抽取是信息检索领域进行文本特征降维的重要手段之一。本文通过x^2统计和特征聚类相结合的模式,在尽量减少信息缺失的前提下两次对特征项维数进行压缩,通
讨论了面向毫米波缝隙天线集成制造应用的三维非硅微加工技术方案,重点解决多种材料兼容、多层复杂微结构集成和大悬空高度等独特难题。针对天线器件中金属和介质材料的结合,
本文指出了普赖斯的连续型信息资源分布模型实质上是在文献总数与作者总数成正比这一假设下建立起来的。其不足之处是没有考虑到现代信息传递手段和信息获取的现代工具等诸多
随着网络信息的迅猛发展,信息处理已经成为人们获取有用信息不可缺少的工具,文本自动分类系统是信息处理的重要研究方向.本文介绍了当今世界上较先进的"变换支持向量机"(TSVM
非相关文献知识发现是Swanson教授提出的一种情报学方法,用于挖掘隐藏在文献之间的隐秘联系。其知识发现过程包括两部分:开放式知识发现过程和闭合式知识发现过程。开发式知识
本文结合搜索引擎的特点,采用网上特尔菲法进行专家调查以确定搜索引擎评价的各项指标,并利用基于指数标度的层次分析法确定各项指标的权重,从而构建搜索引擎评价指标体系.在