论文部分内容阅读
Web日志挖掘技术是Web数据挖掘中最重要的应用.通过对挖掘服务器日志文件的分析和研究,可以对网站的组织结构及其性能进行改进,增加个性化服务,发现潜在的读者群体.数据预处理关系到Web日志挖掘的质量.数据预处理包括数据清理、识别用户、识别用户会话、格式化,目的是分割服务器日志为多个独一无二的用户的一次访问序列,并给予了算法实现.