论文部分内容阅读
随着互联网的飞速发展,Web被广泛的应用于人们的日常生活、学习、工作以及娱乐活动中。Web可以比作为一个巨大的信息收集站,它存储着各种各样的人们所需要的资料信息。在这个信息充足而知识贫乏的时代,由于信息种类的繁多,使得用户容易在庞大的信息中迷失,基于Web日志挖掘的个性化推荐可以有效的解决这个问题。结合Web日志挖掘的个性化推荐的核心是推荐的方法,也是本文研究的重点。马尔可夫(Markov)预测模型简单易行,是一种应用广泛的统计模型,近年来开始应用于用网页预测且比较适合作为智能推荐系统的预测模型。本文针对Markov预测模型在Web数据挖掘的个性化推荐中的应用研究做了以下几点工作:1、对Web日志挖掘和个性化推荐的方法进行研究,重点研究了Web日志挖掘预处理技术,给出了各阶段的算法。然后分别对传统Markov预测模型、混合Markov预测模型、多Markov链模型在构建过程以及预测方法进行了研究。2、基于Markov预测模型提出一种改进算法。该算法用混合树结构代替传统的状态转移矩阵,能同时进行多阶预测;利用用户频繁路径代表用户特征,通过比较频繁路径之间的相似度进行用户分类,降低了用户分类过程的复杂度;引入网页聚类思想,不仅进一步压缩存储空间,且使高阶序列具有较高的匹配度,使推荐结果更加准确。通过实验证明了改进算法的优越性。3、针对改进算法设计基于Web日志挖掘的个性化推荐原型系统。原型系统包含离线部分和在线部分,细分为预处理模块、模式挖掘模块、推荐模块。并详细描述了各模块的功能,以及整个原型系统工作流程。论文针对Web日志挖掘和个性化推荐两大问题做了深入研究,并基于Markov预测模型改进挖掘算法,通过实验证明算法能较好的平衡推荐的实时性和准确性,最后给出个性化推荐原型系统。相信此研究对网站更进一步实现个性化推荐有一定借鉴意义。