论文部分内容阅读
随着移动互联网的迅速发展,中国的移动互联网用户达到12.5亿。网络文学用户大约为3.78亿,原创网络文学作品1300多万本并且网络文学市值达到5000亿元人民币。但在这3.78亿用户中参与评论和评分书籍的用户不到50%,并且仅仅依靠用户对书籍的评论与评分作为推荐依据无法获得用户的兴趣迁移,因此如何获取用户对书籍兴趣是一个值得关注的问题。本文使用用户阅读行为和用户评论行为两类行为数据,在书籍推荐系统中进行了相关研究,利用阅读行为数据解决了不参与书评用户的评分问题,优化了所有用户的兴趣迁移问题。论文的主要研究工作为:(1)通过研究和分析现有的用户行为分析、情感分析和推荐系统相关技术与理论,验证了在推荐系统中使用用户行为分析和情感分析技术的可行性;(2)通过分析、比较全体用户的不同行为数据,得出了受用户对书籍喜爱程度影响最大的两个行为,阅读时长和阅读速度,并针对这两个行为分别建立评分转化模型——时长模型(Time模型)与速度模型(Speed模型),经过一系列分析本文将两个评分模型线性结合得出理想的用户-书籍评分模型,即时长-速度模型(Time-Speed模型);(3)对于参与书评的用户,直接使用Time-Speed模型进行推荐,虽然能解决用户兴趣迁移问题,但推荐准确率不如使用评论评分进行推荐,所以本文使用情感分析的方法将书评数据量化为情感评分,使用情感评分对Time-Speed模型优化,两者之间线性结合,最后将由优化后模型得到的评分送入使用协同过滤方法的推荐系统中。实验结果表明,本文提出的情感评分优化的时长-速度模型,将其使用在书籍推荐系统中明显提高书籍推荐准确率。使用改进后的模型作为推荐系统的输入数据,对不参与书评的用户推荐准确率提高了10%,对参与书评的用户推荐准确率提高了7.5%。