论文部分内容阅读
随着计算机与Web2.0技术的快速发展,互联网产生了巨量的数据。面对良莠不齐的大量数据,用户很难有效地提取自身真正需要的信息资源,这正是当今普遍存在的“信息过载”(Information Overload)问题。为了解决这一难题,人们创造了搜索引擎、门户网站等多种分类、信息过滤的工具。然而,这些工具不能很好的满足用户个性化的需求,正是有着这样的需求,由此诞生了个性化的推荐系统。近年来,个性化推荐算法成为了学术界研究的热点。然而,传统的标签推荐算法存在一定局限性,面向具体应用时难以做到快速、高准确度的个性化推荐。针对这一问题,本文提出了一种层次化的标签推荐算法(Hierarchical Tag Recommendation Algorithm,HTRA)。本文主要工作包含以下:首先在算法分析研究的基础上,本文采用del.icio.us数据集论证了在为物品添加标签时,使用余弦相似度的计算方法计算标签相似性,能够得到更高的精确度。其次,深入分析了传统标签推荐算法存在的缺陷,并以此为基础,提出一种层次化的标签推荐算法,该算法利用标签数据来表征用户、物品的特征信息,从而得到用户对历史物品的兴趣偏好;最后,计算历史物品与待推荐物品之间的相似度,并引入调节因子将用户的兴趣偏好与物品相似度相结合,最终预测到用户对物品的偏好值。通过算法仿真实验,验证了本文算法的有效性,且推荐准确度有所提升。针对联培企业在线广告推荐项目实际需求,本文通过详细分析推荐系统的具体功能需求和性能需求,设计并搭建了个性化推荐系统总体架构,详细设计了相应的功能模块。使用MySql数据库,实现了基于NodeJs的广告推荐系统,该系统主要包括三个部分:主播数据预处理,层次化标签推荐算法的实现以及广告推荐系统的实现。主播数据预处理是按照系统定义的规则提取比较热门的主播信息作为系统用户,算法实现则采用了本文的HTRA算法,推荐系统实现完成了注册登陆、发布广告、推荐等系统的主要功能。最后对系统的功能和性能进行了测试与分析,结果表明本文实现的推荐系统具有较好的推荐质量。