论文部分内容阅读
互联网的高速发展和移动电子设备的普及,给人们的生活带来了前所未有的改变。人们可以突破时间和空间的限制,自由获取海量的在线信息资源。互联网在促进生活方便的同时,也给人们带来了信息过载的困扰。推荐系统应运而生,作为解决信息过载问题的最有效工具,被广泛的应用于生活的各方面。推荐系统不仅帮助在线用户从海量的信息中发掘有用的信息、发现潜在感兴趣的物品和服务,还帮助内容提供商和生产者提高物品的曝光度、增加销量和保持用户黏度。近几十年来,推荐系统在工业界取得了优秀的应用成果,同时吸引了计算机、物理、社会经济等不同领域许多科研人员的关注,推荐系统已经成为目前研究的热点。关于推荐系统的一系列理论研究,很大程度上推动了其不断的革新发展和具体应用。然而,推荐系统的研究到目前为止仍然存在一些困难和挑战。推荐系统的“准确性和多样性困境”问题,一直以来都是推荐系统在长期运行后所要面临的难题。推荐系统过于注重推荐的准确性,而往往忽略推荐的多样性,这导致后续推荐给用户的物品越来越相似,可供系统推荐的物品列表越来越窄。另外,推荐系统还面临着冷启动问题。新用户和新物品进入系统后,由于缺少相应的历史评分信息,推荐系统容易给出不合理的推荐。一方面,考虑到大多数推荐算法是基于用户或物品之间的相似性计算,通过设计更为合理的节点相似性计算指标,有希望最大程度的平衡推荐结果的准确性和多样性。另一方面,考虑在推荐算法的设计中引入辅助信息,包括用户之间的社交关系和用户自身的兴趣标签等,利用辅助信息来提升推荐算法的性能和解决推荐系统的冷启动问题。在解决推荐系统所面临的问题上,本文针对其中准确性和多样性两难问题以及冷启动问题展开研究。对准确性和多样性两难问题,首先,分析二部图上节点相似性指标对推荐结果的影响,提出一种新的节点相似性计算方法,基于此相似性的推荐算法同时提高准确性和多样性;其次,利用推荐系统中用户之间的信任关系作为辅助信息,在节点相似性的推荐算法和物质扩散推荐系统框架下,分别提出信任增强推荐算法,进一步提高算法的准确性和多样性。对冷启动问题,使用推荐系统中用户自身的标签信息,在引力模型框架下来计算用户对物品的偏好,提出一种基于标签的推荐算法,在解决推荐系统冷启动问题的同时,提高推荐结果的准确性和多样性。同时,从基于标签的推荐网络演化和用户对标签信息采纳的传播动力学两方面,对标签信息的做了更深入的研究。本文的具体研究内容和主要创新点如下:(1)基于新型相似性的推荐算法研究。考虑基于相似性的推荐算法,分析了相似性的选择对推荐结果准确性、多样性和新颖性的影响。结果显示,基于余弦相似性的协同过滤推荐算法的准确性高,但多样性较差;基于资源分配相似性的推荐算法的多样性好,但准确性不足。通过混合余弦相似性和资源分配相似性指标,提出了一种新的相似性度量指标(CosRA)。进一步,在物质扩散的推荐系统框架下,提出了一种基于CosRA指标的推荐算法。在真实数据集上的实验结果显示,基于CosRA指标的推荐算法表现出更好的推荐结果准确性、多样性和新颖性。所提出的CosRA指标没有参数依赖,推广得到一般化的CosRA指标不能显著提升推荐算法效果,这表明CosRA指标已经是最优形式。作为一个普适的相似性度量方法,提出的CosRA指标在推荐系统的实际应用中更有优势。(2)基于信任增强的推荐算法研究。利用推荐系统中用户之间的信任关系作为辅助信息,将其引入到基于CosRA指标的推荐系统框架中,提出了一种基于信任增强的推荐算法。在资源分配过程中,将受信任用户的资源总量通过一个可调参数进行调整。结果显示,可调参数存在一个几乎不依赖于数据集的最优值,这时推荐算法表现出最高的准确性。由于可调参数控制着受信任用户资源总量的放大或缩小,这一结果表明,在推荐过程中适当考虑用户信任关系能提升推荐效果,但过分增强受信任用户的影响将会适得其反。进一步,在物质扩散推荐系统框架下考虑信任关系的作用,提出了一种基于信任关系的物质扩散推荐算法,分析了受信任用户在资源分配权重上的变化对推荐效果的影响。结果显示,适当的增强受信任用户在资源分配上的权重,能够显著提高推荐算法效果。(3)基于标签的推荐算法研究。针对推荐系统所面临的冷启动问题,标签信息体现用户的兴趣偏好和选择倾向,引入用户的标签信息进行辅助推荐。在引力模型框架下,结合用户的标签等辅助信息来预测用户可能感兴趣的物品,提出了基于标签的推荐算法。实验结果显示,提出的推荐算法相对于基准算法提高了准确性和多样性。尤其针对新加入物品的推荐,基于标签的推荐算法的时间复杂度不显著增加,有利于在实时推荐系统中的应用。随后,将用户的标签信息与引力机制模型相结合,分析了几种典型模型网络中用户属性和商品特征的演化规律。进一步,考虑用户对标签信息的采纳过程和信息传播规律,提出了一种基于非马尔科夫过程的多层网络标签信息传播模型,能够解释复杂的社会信息传播现象。