论文部分内容阅读
该文提出一种改进的基于Web日志挖掘用户偏爱浏览路径算法。通过引入站点拓扑结构图来建立用户的访问矩阵,使用夹角余弦公式求出访问矩阵的相似度矩阵,将相似度高的页面归为一类,称为基于相似度矩阵的用户偏爱浏览路径候选集,引入访问矩阵的权重矩阵来降低由于主干路径访问频度高而对挖掘结果造成的影响,结合访问权重利用有效偏爱度过滤上述的候选项集,得出基于权重的用户偏爱浏览路径项集,最后通过合并这些项集得到符合用户浏览习惯的偏爱路径。实验表明该算法更能反映用户真实的浏览兴趣与意图。