论文部分内容阅读
随着大数据时代的来临,越来越多的应用程序应运而生。为了提升用户的使用体验,增大用户黏性,个性化推荐算法成了各大应用程序寸土必争的领域。目前主流的个性化推荐算法大部分是通过用户以往对于产品的评分来研究用户的喜好,进而向用户提供推荐列表。然而,目前面临的难题是网络上用户评分过于集中,评分可信度不高,导致推荐算法的推荐准确率并不理想。
网络信息越来越丰富,能体现用户情感的信息也越来越多,除了用户的评分,用户的评论也可以作为推荐算法的依据。因此基于情感分析的个性化推荐算法,从各类推荐算法脱颖而出,成为了目前各大研究团队研究的热点。为了筛选出用户评论中这些表达用户情感的信息,需要中文分词技术;为了将这些情感信息量化为数值,需要设计情感量化模型;为了实现精准推荐,需要使用协同过滤推荐算法。如何将中文分词技术,情感分析技术,结合到协同过滤推荐算法中,实现基于情感分析的个性化推荐算法,提升推荐准确率,本文将针对这些问题展开研究。
针对当前电影评分可信度较低和区分度不高影响推荐算法效果的问题,本文设计了一种改进的协同过滤算法:利用中文分词技术及情感分析技术来分离出用户影评中的情感词、否定词和程度副词;依据情感量化模型计算影评中的情感态度,利用计算的影评中的情感态度量化值对评分进行修正,使得修正后的评分更接近用户内心的真实评分意愿;把修正后的评分带入协同过滤推荐算法,产生更准确的推荐结果。
本文通过分析用户影评中每一个情感词、否定词和程度副词,将用户的影评进行情感量化。其中,每一个正面情感词代表单位1,每一个负面情感词代表负的单位1;每一个否定词改变一次其后出现的第一个情感词的情感极性;每一个程度副词根据级别的不同,扩大或者缩小其后出现的第一个情感词的情感强度的权值。
本文将评论与评分结合的问题转换成单数值优化问题。假设修正后的评分y=w*score+(1-w)*degree,通过实验选择使推荐算法准确率及召回率最高的w作为修正评分的参数。本文在考虑选择哪种协同过滤算法时,根据本文数据的特殊性,分别使用基于用户和基于物品两种不同的协同过滤推荐算法,对比实验结果选择推荐效果更好的协同过滤算法。
本文进行了大量的实验与研究,最后实验结果证明:本文基于情感分析的推荐算法的改良,在准确率和召回率上,比仅考虑评分的推荐算法和仅考虑影评的推荐算法得到了一定提升,即综合考虑影评与评分的推荐算法优于只考虑影评或评分的推荐算法。
网络信息越来越丰富,能体现用户情感的信息也越来越多,除了用户的评分,用户的评论也可以作为推荐算法的依据。因此基于情感分析的个性化推荐算法,从各类推荐算法脱颖而出,成为了目前各大研究团队研究的热点。为了筛选出用户评论中这些表达用户情感的信息,需要中文分词技术;为了将这些情感信息量化为数值,需要设计情感量化模型;为了实现精准推荐,需要使用协同过滤推荐算法。如何将中文分词技术,情感分析技术,结合到协同过滤推荐算法中,实现基于情感分析的个性化推荐算法,提升推荐准确率,本文将针对这些问题展开研究。
针对当前电影评分可信度较低和区分度不高影响推荐算法效果的问题,本文设计了一种改进的协同过滤算法:利用中文分词技术及情感分析技术来分离出用户影评中的情感词、否定词和程度副词;依据情感量化模型计算影评中的情感态度,利用计算的影评中的情感态度量化值对评分进行修正,使得修正后的评分更接近用户内心的真实评分意愿;把修正后的评分带入协同过滤推荐算法,产生更准确的推荐结果。
本文通过分析用户影评中每一个情感词、否定词和程度副词,将用户的影评进行情感量化。其中,每一个正面情感词代表单位1,每一个负面情感词代表负的单位1;每一个否定词改变一次其后出现的第一个情感词的情感极性;每一个程度副词根据级别的不同,扩大或者缩小其后出现的第一个情感词的情感强度的权值。
本文将评论与评分结合的问题转换成单数值优化问题。假设修正后的评分y=w*score+(1-w)*degree,通过实验选择使推荐算法准确率及召回率最高的w作为修正评分的参数。本文在考虑选择哪种协同过滤算法时,根据本文数据的特殊性,分别使用基于用户和基于物品两种不同的协同过滤推荐算法,对比实验结果选择推荐效果更好的协同过滤算法。
本文进行了大量的实验与研究,最后实验结果证明:本文基于情感分析的推荐算法的改良,在准确率和召回率上,比仅考虑评分的推荐算法和仅考虑影评的推荐算法得到了一定提升,即综合考虑影评与评分的推荐算法优于只考虑影评或评分的推荐算法。