基于最大熵模型解决协同过滤稀疏性问题研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:jinr0op3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着Internet的普及,网上购物已经越来越成为一种重要的消费行为,但在呈指数级增长的海量信息面前,用户往往无法快速、准确的挑选到自己钟爱的商品,而推荐系统这是基于这样的背景产生的。推荐系统主要通过挖掘用户的兴趣爱好,从而为用户提供推荐。   协同过滤作为目前推荐质量最高的推荐系统,也是应用最为广泛的推荐系统。它主要利用用户对于商品的历史评分数据,计算出当前用户的“最近邻集合”,然后利用这些“邻居”计算出当前用户对于目标项目的预测评分,最后根据预测评分形成推荐。虽然协同过滤有着诸如算法简单、可以处理不同特征数据、挖掘用户潜在兴趣等优点,但它也存在着很多缺点。其最大的缺点即数据稀疏性,数据稀疏性实际上就是一个用户—项目评分矩阵稀疏的问题,因为在现实生活中,大部分的用户都只对少部分的项目有评分,所以大部分的评分都是空白,当然也就无法保证良好的推荐质量。   最大熵模型作为一个基本预测模型,它的基本思想就是在只掌握未知部分的部分知识时,我们应该选取符合这些知识并且熵值最大的概率分布。最大熵模型最大的特点就是可以将不同源的信息集中到一个框架下进行综合考虑。大众分类标签(tag)是伴随着web 2.0和3.0 才被广泛应用的,是分享知识的一种机制。Tag的最大特点是充分反映了用户的主观性。   为了解决传统协同过滤推荐系统中的稀疏性问题,本文提出了一个基于最大熵模型,且综合考虑用户—评分信息(rating)和tag 信息的混合推荐系统。文中构建的最大熵模型把rating 信息和tag 信息作为模型输入,在经过最大熵模型处理后,把当前用户对于目标项目的评分作为模型输出结果,从而形成推荐。   基于理论研究,本文设计了3组仿真实验从不同的角度来验证基于最大熵模型的混合推荐系统的推荐质量,实验结果表明,混合推荐系统较传统协同过滤有着较高的优越性
其他文献
语文作为高中教学中的重要科目,如何提高高中生语文的学习能力是每一位教育工作者值得思考的问题。大量的教学实践证明,有效阅读是促进语文学习能力增长的有效措施,所以,本文
新课改由原来的风起云涌到如今的沉静内敛,沉淀出了许多有价值的东西,“微观细读”阅读教学法便是新课改中语文课堂备受关注的成果之一。何谓“微观细读”?它是孙绍振教授对
语文课程标准(2011版)强调:“语文课程是一门学习语言文字运用的综合性、实践性课程。”“语文课程致力于培养学生的语言文字运用能力。”“语用”理论的提出,标志着语文教学
在文学类文本阅读教学中,教师引导学生进行主旨探究是课堂教学环节中的重要内容。但是有的教师对文本本身缺乏深刻解读,导致这个环节形同虚设,简单粗略地用“口号式”“模式
期刊
初中学生在写作中经常出现要么言之无物,干瘪空洞;要么拖沓冗长,废话连篇等问题。本文提出通过一系列的画面感作文指导训练课,让学生在写作过程中构建起“画面感”思维模式,
进入新世纪,中国作为一个发展中国家,政府采取了积极的财政政策对推动经济增长和转轨方面起着重要的作用。随着经济的快速发展,我国各级政府部门普遍加大了对公共项目的投资力度