基于大规模用户隐式行为反馈的书籍推荐方法研究

被引量 : 0次 | 上传用户:xiaosongs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于协同过滤算法的书籍推荐系统能够向用户提供个性化的书籍推荐,方便人们的阅读行为并提高人们的阅读效率。但当前大多数书籍推荐应用中普遍存在缺少用户对书籍的评分数据甚至没有评分数据的情况,即使在有用户评分的情况下,也存在用户评分数据不准确、评分稀疏等问题,这使得传统协同过滤推荐算法的应用受到阻碍。针对上述问题,本文展开了基于大规模用户隐式阅读行为数据的书籍推荐方法研究。基于真实的海量用户阅读日志数据,本文首先利用Hadoop分布式平台对大规模用户阅读行为进行预处理,并对相关用户隐式阅读行为数据进行分析,利用数据预处理得到的数据集对用户阅读行为数据进一步的统计与计算,为建模做好准备;然后,本文提出了一种基于用户隐式行为的书籍推荐方法,在一定程度上解决了书籍推荐系统中用户评分缺失的问题,并通过实验证明,所提方法与传统的经典协同过滤方法相比,提高了推荐准确率。本文的主要工作和成果总结如下:(1)为了提高对大规模数据处理的效率,本文采用基于Hadoop分布式平台的MapReduce数据处理模型,先将海量数据进行过滤、清洗等数据预处理工作,得到有效的用户隐式行为数据,再对已清洗过的用户行为数据进行进一步的统计和计算。利用大规模数据处理方法提高了本文工作的效率,并在一定程度上提高了用户阅读行为数据的准确度。(2)为了解决书籍推荐系统中评分数据不准确、评分稀疏等问题,提高书籍推荐的准确率,本文提出了一种基于用户隐式阅读行为数据的评分模型:时间-频次模型(T-F Model)。将具有价值的用户隐式行为数据转化为用户评分数据,填充用户-书籍评分矩阵,实现准确的面向书籍的协同过滤推荐。(3)为了验证基于大规模用户隐式行为反馈的书籍推荐方法有效性,本文将处理好的数据集分为训练集与测试集,利用训练集预测用户对书籍的评分,并根据评分高低产生书籍推荐,从时间和频次分别取不同的权值、分别利用基于用户和基于项目的协同过滤算法产生推荐等几个方面,与传统基于简单评分矩阵的协同过滤推荐方法进行比较,证明了本文所提方法的准确性与可行性。
其他文献
家禽视觉系统高度发达,LED光源优点突出,两者协同创新并正在迅速形成新的交叉领域。综述了具有代表性的家禽——鸡规模养殖LED光环境调控技术的研究现状。在肉鸡方面,通过LED
中医是治证的,辨证论治是中医的精髓,山西中医学院傅山学院高建忠副院长临床善于辨证论治,将中医"证同治亦同,证异治亦异"的理念发挥的淋漓尽致,下面是高老师的3则异病同治的
高原寒湿性腰背痛是直接影响人类生活质量的主要慢性疾病之一,他包括脊柱关节,椎间盘脱出,退行性骨关节炎及滑膜炎等是以劳损和退变为主的一组疾病。目前临床治疗上多采用非
随着社会生活水平不断提高及医疗市场竞争的日益激烈,人们的健康、维权意识不断增强,护理工作中的服务理念、意识、态度、效率、氛围等也越来越被患者所关注,精细化护理管理
分别于小麦苗期和成株期,比较了两种不同的小麦纹枯病菌接种方法的效果,结果表明,利用嵌入法接种的效果明显优于外贴法.
<正>一、《傲》的婚姻观《傲》真实地反映了18世纪末19世纪初英国乡村中产阶级的爱情观和婚姻观。小说主要描写了住在浪博恩村的班纳特家的几位女儿她们各自的爱情,以及她们
排球运动是一项集竞技、娱乐、健身于一体的运动项目,具有较高的锻炼和健身价值。但近年来,这项适宜于在不同年龄阶段参与的运动项目,在武汉市中小学体育活动的开展中却倍受
以永磁同步电动机矢量控制为基础,分析了转子谐波磁通和电动机参数变化对电流控制器性能的影响。并通过复矢量模型,指出高速下耦合电压使得电流控制性能恶化。针对励磁电流分
行政机关公开公共信息是现代法治的基本要求 ,是构建宪政制度的基础。本文较系统地分析了行政机关公开公共信息的宪法基础和行政法基础 ,论证了公开公共信息的理论与实践价值