论文部分内容阅读
随着各大音乐网站蓬勃发展,使用音乐APP成为人们生活不可或缺的一部分。为了更好满足用户寻找喜爱的音乐歌曲,利用算法构建音乐推荐系统进行歌曲分发越来越重要。其中,协同过滤算法被广泛应用在各大音乐推荐系统召回过程中。传统的协同过滤算法对用户和音乐的相似度刻画粒度较粗,且推荐召回结果都集中在头部热门,个性化程度较弱。因此,如何利用挖掘用户信息和音乐歌曲信息改善传统的协同过滤算法,进行更有效的推荐召回,提高整体推荐系统效果。是当前许多学者主要的研究方向。本文结合公司实际K歌App音乐推荐系统项目,对音乐推荐系统召回算法进行了研究,主要研究内容包括以下四点:(1)针对原始标签数据较少,在基于LDA模型分类时效果较差的问题,提出一种基于歌词关键词对原始标签补充的LDA音乐主题表示方法。该方法通过TF-IDF算法抽取歌词关键词对原始标签进行补充,提升文本的完整性,然后通过LDA模型训练出音乐主题分类。实验表明该方法能够提高LDA模型学习效果,达到准确表示音乐主题的目的。(2)针对用户兴趣难以被精准刻画的问题,提出基于图嵌入技术用户兴趣表示方法。该方法从用户行为中挖掘出用户兴趣偏好,通过Node2vec模型在会话内的用户正反馈行为的音乐歌曲建模,学习出对应的音乐歌曲向量。然后对用户不同的行为定义不同的权重,加权融合用户正反馈的音乐歌曲向量序列,得到用户兴趣向量表示。实验表明,通过该方法对用户兴趣进行表示的准确度较高,对用户兴趣刻画比较细致。融合所得的向量能够很好的代表用户兴趣。(3)针对原有协同过滤算法集中召回歌曲集中在热门歌曲且个性化程度不够的问题,提出一种融合音乐主题信息和用户兴趣信息改进的协同过滤算法。将上一部分的得到的音乐主题信息计算音乐主题的相似度,将主题相似度作为权重加入到ItemCF算法音乐相似度计算之中。又根据得到的用户兴趣信息,计算用户兴趣相似度,将所得的相似度作为权重分别加入UserCF 算法用户相似度计算之中。实验表明,在加入音乐主题相似度和用户兴趣相似度之后,改进的协同过滤算法效果较传统的协同过滤算法,召回效果提升显著。(4)在以上三个内容的基础上,通过融合音乐主题表示层,用户兴趣表示层,音乐歌曲召回推荐层,在原有的精排序和重排序层和AB测试框架的基础上实现完整的基于原始标签的音乐推荐系统。