基于LDA的社会化标签系统推荐技术研究

来源 :华南农业大学 | 被引量 : 0次 | 上传用户:yangmingli1213
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络的迅猛发展,社会化标签系统成为众多新型网络应用的不可或缺的一部分,并因其操作便捷、操作简单等优点深受互联网用户的喜爱。标签推荐系统可以推荐相应的标签给用户,既方便了用户的操作又提高了系统标注的质量,但是会产生大量富含价值的数据,从而形成“用户-资源-标签”的三维模型。目前的标签推荐算法基本都是借鉴传统的推荐算法,将这种三维关系拆分成二维关系来解决,而这种转换过程容易导致用户信息的描述模糊、语义丢失、标签的个性化信息减弱的问题,进而限制了个性化推荐的效果。针对现有方法存在的不足,本文以Cite ULike数据集为研究对象,提出了一种基于LDA模型的个性化标签推荐模型LTR。该模型运用主题模型的思想解决社会化标签系统的推荐问题,为了更加合理地设计推荐模型,首先对社会化标签系统、主题模型和LDA等相关知识进行了更深一层的探索。其次提出综合考虑用户、标签、资源和资源的语义信息,从话题语义层面来挖掘用户和资源、标签和资源、资源之间的内在联系,构建了基于主题模型的社会化标签推荐模型LTR。本文在CiteULike真实数据集上进行了两组的相关对比实验,从两个角度分别验证该算法的推荐效果:(1)固定推荐长度下,比较LTR算法与目前的主流的HOSVD、FolkRank、DirectBin25、SK5、Popitem、UCTM、Majdi’s Method方法的准确率、召回率和F1值,验证该算法的推荐效果;(2)不同密度的数据集下,计算LTR算法在稀疏数据集和相对紧密的数据集下,推荐长度从少至多逐渐递增过程中的准确率、召回率和F1值,验证该算法各阶段的推荐效果。实验结果说明LTR算法在考虑了具有丰富语义信息的摘要文本下,发挥了涵盖用户意识的个性化标签来增强推荐的准确性,不但能为用户提供个性化推荐,而且相比现有算法能获得更好的推荐效果,一定程度上解决了用户兴趣提取不准确问题和在稀疏数据的情况下,LTR推荐能力更有优势。
其他文献
随着社会的高速发展以及生活压力的增加,人们在日常生活中难免会面临诸如升学、就业、婚姻等问题。这些问题带给人们不同程度心理压力的同时,还伴随着抑郁、焦虑等负面情绪的产
关联规则挖掘是数据挖掘的方法之一。关联规则挖掘通过分析训练数据集,从其中找到潜在的、有价值的知识。关联规则挖掘在商业领域中有着广泛的应用,著名的“尿布与啤酒”的例
随着网络技术的迅猛发展,信息呈现出爆炸式增长。信息检索系统已经成为网络世界中获取信息不可或缺的手段。然而传统基于关键词的信息检索技术并不能准确地理解用户真实需求,
随着嵌入式技术和数字信号处理技术的发展,数字信号处理芯片在日常生活中的应用越来越广泛。但随着系统复杂度的提高,DSP程序的开发和调试的难度也越来越大。而传统的DSP程序开
单核苷酸多态性(Single Nucleotide Polymorphism,SNP)是指在基因组DNA序列中由单个核苷酸(A,T,C,G)的变异所引起的多态性,它是人类基因组中分布最为广泛且富含遗传信息的多态性。S
随着计算机应用技术研究的深入发展,蒙古文信息处理技术也得到了迅速地发展。我国从上世纪70年代末就开始了蒙古文信息处理的研究工作,研究的重点主要集中在蒙古文文字处理方
掌纹识别作为一种重要的生物特征识别技术,具有安全性、方便性、稳定性等优点,因而在过去十几年里受到了广泛的关注并取得了大量的研究成果。然而,与传统的接触式采集相比,掌
桥梁结构作为现代交通系统的重要基础,其安全与健康不仅关系着国家的社会、政治、经济、国防等各项事业的健康有序发展,而且也直接影响着人民的生命、财产安全。然而,桥梁结构运
《中国家庭发展报告2015》指出家庭结构发展中家庭规模小型化和家庭养老需求与医疗养老结合的需求越来越大等特点。独居老人作为家庭成员中重要监护对象,多种老年疾病的影响
概念格理论,作为一种高效的数据分析工具,已经广泛地应用于数据挖掘、软件工程、信息检索等领域。其中概念和概念格是此理论的基础,在一般情况下,概念格中的概念数是输入背景大小