LDA模型的研究及其在推荐系统中的应用

来源 :浙江大学 | 被引量 : 0次 | 上传用户:liouyun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
主题模型是用来发现文章中隐藏的主题的一种统计方法,这是一种应用范围十分广的生成模型。该模型假设每个文档里存在很多个隐藏的主题,而由于文档的性质和类别不同,使得每篇文章的主题分布情况是不同的。主题模型就是利用文章的这个特点,根据每篇文章的主题分布建立模型。主题模型的应用范围十分的广泛,而且在许多领域的应用效果也十分的显著。本文就是以LDA(Latent Dirichlet Analysis)主题模型为研究对象,针对模型的改进和模型参数的估计进行了进一步研究。首先,考虑到在电子商务中在购买商品之后还可以对所购买的商品进行评分。所以,我们对LDA模型进行了改进,加入了对商品的评分。并且,针对离散型评分和连续型评分我们分别对LDA模型进行了改进,然后用变分EM算法进行了参数估计。其次,由于在对改进后的LDA模型用变分EM算法进行参数估计的过程中,我们发现目标函数的下界是我们假设的变分分布的熵。而熵表示的是随机变量的不确定性,即我们假设的变分分布的不确定性。由此,我们提出用TEM(Tempered Expectation Maximization)算法对模型进行参数估计。该算法通过对目标函数的中的熵除以一个参数τ,从而降低由于假设的变分分布的不确定性而对模型造成的影响。最后,我们将改进后的LDA模型应用到MovieLens数据集上进行验证,并通过交叉验证的方法与基于用户的协同过滤以及PLSA模型进行对比。得到改进后的模型效果优于其他模型,而这两种模型中,连续型数据的模型效果优于离散型的模型。
其他文献
本文我们首先通过考虑欧氏空间中子流形中的Bochner型公式,分别得到了具有常平均曲率超曲面的Bochner不等式(公式略)(1)和欧氏空间中高余维极小子流形的Bochner不等式(公式略)(2)我们
青春期的学生叛逆性强,班主任要通过多种直观的具有感染性的方法进行引导;注重与学生的沟通,关心引导学生;选好配强班干部队伍;组织开展参与性强的集体活动及关注学生的心理成长等
大多数成功人士都具有相同的特点:做事很有自制力,较少受到外界因素的干扰;遇到挫折,忍耐力较强;做事有计划,并从按时完成计划中获得成就感;情绪智力高,能换位思考,了解并体谅他人的情
作为一名语文教师,这么多年听了许多节震撼内心的语文课,也讲了许多节意犹未尽的语文课,其中,笔者发现一个相同之处:音乐与语文的整合,让我们的课堂变得美妙,变得精彩!
本文介绍了农村学校安全工作的重要意义,分析了农村学校的一些特点,指出要以“安全第一”为理念来指导学校工作,提出加强安全管理的措施。
“金山岭长城杯全国书法展”评选工作顺利完成。奉人作为监委,参与仝过程。这里谈一谈我个人的所见、所闻、所感。这次书法展收到应征作品近一万二千件,是近年同类书法展中收
本文在阐述智慧旅游概念的基础上,分析智慧旅游对旅游传统岗位的影响,并提出高职旅游专业人才培养的策略,以期对高职高专旅游专业院校的教学改革有一定的借鉴意义。
现实世界中,存在大量的复杂系统,这些系统都可以用复杂网络来表示,例如,Internet网络,演员合作网、新陈代谢网、航空网等。这些不同类型系统的拓扑结构有着纷繁复杂的表现,但普通网
生而为人,不可无展望。人的寄托,除了子女后辈,有时也会安放在植物身上。凌霄善攀,丝丝蜿蜒,步步不辍,仿佛人类在探索中从未停下的脚步;百年好合,是婚姻制度形成以来,对天下
本文运用上下解的单调迭代方法,全连续算子的Leray-Schauder不动点定理和锥映射的不动点指数理论讨论三阶非线性微分方程  此处公式省略  2π周期解的存在性与唯一性及正2