推荐系统中融合社交关系和隐式反馈挖掘的研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:cznay
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术和Web2.0的快速发展,信息的爆炸式增长造成了信息过载的现象。推荐系统是克服信息过载问题的有效工具,它通过分析用户的历史行为挖掘用户兴趣,从而主动给用户推荐能够满足他们兴趣和需求的信息。大数据时代,推荐系统待处理的数据规模越来越大,个性化推荐技术面临着新的挑战。其中,冷启动问题、数据稀疏性问题、大数据处理与增量技术等问题表现的较为显著。  现阶段的协同过滤算法只利用了用户对项目的浅层打分数据,使得推荐性能深受冷启动和数据稀疏性的影响。目前关于这方面的研究主要集中于增加额外的数据源和充分利用有限行为数据。但是如何从横向融合多源异构信息与纵向深挖有限信息来进一步提高推荐性能是一个值得深入研究的方向。本文在深入研究多源数据融合和用户隐式反馈行为的基础上,提出了两个个性化推荐算法,在一定程度上缓解数据稀疏、冷启动和扩展性问题,具体工作包括:  (1)提出一种新颖的融合信任关系和有用性评价的矩阵分解推荐方法(DualSocTrust)。DualSocTrust算法从增加额外数据源方面着手,在对评分矩阵概率分解的基础上,加入用户信任关系和有用性评价信息。采用交替最小二乘法训练模型参数。基于Epinions和Ciao数据集上的实验表明,与近三年来多个流行的算法(如PMF算法,DualRec算法)相比,DualSocTrust算法在推荐结果的RMSE和MAE上具有比较大的提高,有效缓解了个性化推荐系统中面临的数据稀疏和冷启动问题带来的负面影响。  (2)提出一种融合用户间好友关系和社会化标签的协同过滤算法(FT-CF)。FT-CF算法从深挖有限行为数据方面着手,首先借助于网络资源分配算法来对社交网络的结构信息提取特征;利用IF-IDF构建合理的社会化标签模型。然后,利用线性模型融合两方面的信息,从而实现推荐。基于Lastfm和Delicious数据集的实验表明,与近三年来多个流行的算法(PRT-CF算法、CRAUST算法)相比,FT-CF算法在准确率和召回率上都具有较大提高,有效缓解了个性化推荐中的数据稀疏性问题。  (3)完成了本文提出的融合信任关系和有用性评价的矩阵分解推荐方法的分布式实现。通过DualSocTrust模型的设计,将预测评分转化为最优化求解问题。对比分析了几种常用的最优化求解方法。为了评测该算法在大规模数据集上的计算性能,本文设计并实现了基于迭代式计算的Apache Spark上的分布式算法。
其他文献
航天嵌入式软件是面向航天领域的特殊的嵌入式软件,它的可靠性和健壮性直接关系到航天飞行器的安全。如果没有对软件进行充分的调试和验证,一旦出现问题,不仅造成飞行器的损毁,甚
随着形式概念分析在数据挖掘、知识发现等领域的深入研究,其理论的扩展也开始受到越来越广泛的关注。三元概念分析作为形式概念分析的一种三元扩展,是一种新的分析三维数据的理
洪涝灾害是世界上影响最大的自然灾害之一,城市洪涝灾害已经成为了世界性的难题。一个避免城市洪涝灾害问题的方法是通过提高排水系统输送水资源的效率减少因泵站溢流造成的人
网格计算最高目标是能够同电网一样使用网格中的资源,网格中的资源包括计算机,集群,计算机池、仪器、设备、传感器、存储设备、数据、软件等实体以及实体工作时所需要的软件和数
在对数据进行分类时,有效的特征提取方法是取得良好分类效果的重要前提。然而,由于现代信息的海量性、非结构性以及非线性等特征,使得特征提取成为模式识别、机器学习等领域的新
并行概率规划(PPP)是近年来智能规划领域中的研究热点。在并行概率规划问题中,放松了经典规划对所描述问题的严格约束,使得动作具有并发性和不确定性,从而能够更好的描述现实问题
近年来,随着移动智能终端设备的普及以及社交网络规模的高速增长,为了满足日益增长的用户需求,越来越多的科研工作者开始投入到移动社交网络的研究热潮中。在移动社交网络中,节点
学位
随着现代网络技术的不断发展,微博、淘宝和支付宝等的广泛使用,网络安全问题日益成为人们关注的焦点问题,也是研究者们急需解决的问题。而传统的防火墙对于入侵攻击行为只是
近年来,借力于计算机三维辅助设计制作方法的不断进步,动漫产业已由一个新兴产业发展成为一个庞大的、成熟的高收益产业。研究如何利用计算机图形学、人工智能、虚拟现实等相关