基于社交网络个体行为特征的信息推荐算法研究

来源 :电子科技大学 | 被引量 : 8次 | 上传用户:Linuxy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的高速发展和移动电子设备的普及,给人们的生活带来了前所未有的改变。人们可以突破时间和空间的限制,自由获取海量的在线信息资源。互联网在促进生活方便的同时,也给人们带来了信息过载的困扰。推荐系统应运而生,作为解决信息过载问题的最有效工具,被广泛的应用于生活的各方面。推荐系统不仅帮助在线用户从海量的信息中发掘有用的信息、发现潜在感兴趣的物品和服务,还帮助内容提供商和生产者提高物品的曝光度、增加销量和保持用户黏度。近几十年来,推荐系统在工业界取得了优秀的应用成果,同时吸引了计算机、物理、社会经济等不同领域许多科研人员的关注,推荐系统已经成为目前研究的热点。关于推荐系统的一系列理论研究,很大程度上推动了其不断的革新发展和具体应用。然而,推荐系统的研究到目前为止仍然存在一些困难和挑战。推荐系统的“准确性和多样性困境”问题,一直以来都是推荐系统在长期运行后所要面临的难题。推荐系统过于注重推荐的准确性,而往往忽略推荐的多样性,这导致后续推荐给用户的物品越来越相似,可供系统推荐的物品列表越来越窄。另外,推荐系统还面临着冷启动问题。新用户和新物品进入系统后,由于缺少相应的历史评分信息,推荐系统容易给出不合理的推荐。一方面,考虑到大多数推荐算法是基于用户或物品之间的相似性计算,通过设计更为合理的节点相似性计算指标,有希望最大程度的平衡推荐结果的准确性和多样性。另一方面,考虑在推荐算法的设计中引入辅助信息,包括用户之间的社交关系和用户自身的兴趣标签等,利用辅助信息来提升推荐算法的性能和解决推荐系统的冷启动问题。在解决推荐系统所面临的问题上,本文针对其中准确性和多样性两难问题以及冷启动问题展开研究。对准确性和多样性两难问题,首先,分析二部图上节点相似性指标对推荐结果的影响,提出一种新的节点相似性计算方法,基于此相似性的推荐算法同时提高准确性和多样性;其次,利用推荐系统中用户之间的信任关系作为辅助信息,在节点相似性的推荐算法和物质扩散推荐系统框架下,分别提出信任增强推荐算法,进一步提高算法的准确性和多样性。对冷启动问题,使用推荐系统中用户自身的标签信息,在引力模型框架下来计算用户对物品的偏好,提出一种基于标签的推荐算法,在解决推荐系统冷启动问题的同时,提高推荐结果的准确性和多样性。同时,从基于标签的推荐网络演化和用户对标签信息采纳的传播动力学两方面,对标签信息的做了更深入的研究。本文的具体研究内容和主要创新点如下:(1)基于新型相似性的推荐算法研究。考虑基于相似性的推荐算法,分析了相似性的选择对推荐结果准确性、多样性和新颖性的影响。结果显示,基于余弦相似性的协同过滤推荐算法的准确性高,但多样性较差;基于资源分配相似性的推荐算法的多样性好,但准确性不足。通过混合余弦相似性和资源分配相似性指标,提出了一种新的相似性度量指标(CosRA)。进一步,在物质扩散的推荐系统框架下,提出了一种基于CosRA指标的推荐算法。在真实数据集上的实验结果显示,基于CosRA指标的推荐算法表现出更好的推荐结果准确性、多样性和新颖性。所提出的CosRA指标没有参数依赖,推广得到一般化的CosRA指标不能显著提升推荐算法效果,这表明CosRA指标已经是最优形式。作为一个普适的相似性度量方法,提出的CosRA指标在推荐系统的实际应用中更有优势。(2)基于信任增强的推荐算法研究。利用推荐系统中用户之间的信任关系作为辅助信息,将其引入到基于CosRA指标的推荐系统框架中,提出了一种基于信任增强的推荐算法。在资源分配过程中,将受信任用户的资源总量通过一个可调参数进行调整。结果显示,可调参数存在一个几乎不依赖于数据集的最优值,这时推荐算法表现出最高的准确性。由于可调参数控制着受信任用户资源总量的放大或缩小,这一结果表明,在推荐过程中适当考虑用户信任关系能提升推荐效果,但过分增强受信任用户的影响将会适得其反。进一步,在物质扩散推荐系统框架下考虑信任关系的作用,提出了一种基于信任关系的物质扩散推荐算法,分析了受信任用户在资源分配权重上的变化对推荐效果的影响。结果显示,适当的增强受信任用户在资源分配上的权重,能够显著提高推荐算法效果。(3)基于标签的推荐算法研究。针对推荐系统所面临的冷启动问题,标签信息体现用户的兴趣偏好和选择倾向,引入用户的标签信息进行辅助推荐。在引力模型框架下,结合用户的标签等辅助信息来预测用户可能感兴趣的物品,提出了基于标签的推荐算法。实验结果显示,提出的推荐算法相对于基准算法提高了准确性和多样性。尤其针对新加入物品的推荐,基于标签的推荐算法的时间复杂度不显著增加,有利于在实时推荐系统中的应用。随后,将用户的标签信息与引力机制模型相结合,分析了几种典型模型网络中用户属性和商品特征的演化规律。进一步,考虑用户对标签信息的采纳过程和信息传播规律,提出了一种基于非马尔科夫过程的多层网络标签信息传播模型,能够解释复杂的社会信息传播现象。
其他文献
本文重点论述了提高基建工程预结算准确性的六个因素.
文章在提出志愿失灵概念的基础上 ,系统地讨论了市场失灵、政府失灵和志愿失灵三者的互动关系与互补作用 ,指出只有三者共同合作成一个整体才能弥补它们各自的不足 ,较好满足
构建了一套具有天津特色的小城镇居住社区低碳评价指标体系,采用层次分析法(AHP)确定指标权重,确立了各指标标志值和评分标准,建立了多层次综合评价模型,将小城镇居住社区划
肝脏是药物代谢及转化的重要场所,也是大多数药物的解毒器官,能处理体内正常的三大代谢产物。某些毒物经过生物转化,可以转变为无毒或毒性较小,易于排泄的物质,故药物与肝脏
目的探讨分析有创-无创序贯机械通气对老年慢性阻塞性肺疾病合并呼吸衰竭患者的临床效果。方法选取2011年5月至2014年9月我院收治的36例老年慢性阻塞性肺疾病合并呼吸衰竭患
在国内多家研究单位进行大量实验的基础上,对固液两相流机理进行了研究,开发了计算管道输送水力坡降及临界输送流速的电算模型.该模型输入、输出界面清晰,使用方便快捷,且经
本文以医院的信息网络建设为主题,在分析医院信息网络建设需求的基础上分析其建设要点,并提出计算机技术在医院信息网络建设中的应用要点,旨在帮助医院不断完善信息网络系统,
将56例肺心病心力衰竭患者按治疗方案不同分成3组,对照组(16例)采用常规治疗,肝素钠组(20例)在常规治疗的基础上加用肝素钠治疗,低分子量肝素钙组(20例)在常规治疗的基础上加
目的:通过Narcotrend麻醉/脑电意识监测系统监测麻醉深度,比较不同麻醉深度下老年高血压患者全麻诱导期气管插管时血流动力学的变化,从而得出依据Narcotrend指数指导气管插管