论文部分内容阅读
随着Web2.0技术的发展,互联网在人们生活中扮演着越来越重要的角色,电子商务的普及和完善大大改变了人们的生活习惯。然而由于网络的飞速发展导致了信息量的膨胀,如何给用户提供有用的信息成为了一个研究热点,推荐系统也应运而生。基于内容的推荐系统利用物品本身的特征形成推荐,然而特征的表示有很大的语义鸿沟。协同过滤推荐系统利用用户的行为和兴趣分析用户间的相似度,综合考虑这些相似用户对于物品的评价来形成对原用户的推荐信息,然而由于现实应用中用户数据的稀疏性导致了相似度计算不准确和协同推荐系统的冷启动问题从而使得推荐结果也不够理想。如何解决语义鸿沟、数据稀疏性带来的问题和系统的冷启动问题成为了推荐算法研究的热点和重点。近年来,随着Twitter, Douban, Facebook等社区产品的发展和流行,网络中的用户可以用标签标注自己感兴趣的物品,用户之间也因为一些交互行为形成了丰富的关系。这些由交互行为形成的联系不仅反应了用户个人的兴趣爱好,也蕴含着用户与用户之间的关系。如何通过挖掘社会网络,语义标注等上下文的信息来协助推荐,从而达到改善推荐结果的目的,成为主动信息推送算法的新思路。本文的主要工作如下:1.为了解决协同过滤算法同冷启动问题,本文提出一种基于社区划分和协同标注的协同过滤算法,算法首先使用社区划分算法对用户所在的社会网络进行划分,提取出各个网络社区;然后通过构建基于用户、物品、标签的三部图模型来计算产生目标用户的候选标签集,最后利用三部图模型中的用户-物品模型和物品-标签模型来产生对用户的推荐。本文提出的算法基于社区划分和社会化标签,能很好地解决语义鸿沟的问题和协同过滤的冷启动问题。2.为了提高推荐系统的准确度,本文提出一种基于社会标注和动态兴趣建模的协同过滤算法。传统的协同过滤计算用户或物品间的相似度时,未考虑用户兴趣的转移,直接计算用户或物品的特征,从而降低了推荐系统的准确率。本文提出基于社会标注和动态兴趣建模的协同过滤算法,使用艾宾浩斯遗忘曲线重构用户-标签模型;通过社区划分提取出目标用户的候选标签集,最后利用三部图模型产生对用户的推荐。3.在以上算法研究的基础上,实现了基于社交网络的大学数字图书馆主动推荐系统。系统基于社交网络人人网,使用三层建模,利用Python和Flex技术搭建数字图书主动推荐平台。由于系统提供主动推荐服务,用户能够很好的享受读书阅读服务,在三个月内该平台的推广人数达到近2万人,排名人人网读书应用第三名。