基于社会网络的主动信息推送算法研究

来源 :杭州师范大学 | 被引量 : 18次 | 上传用户:csfyl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0技术的发展,互联网在人们生活中扮演着越来越重要的角色,电子商务的普及和完善大大改变了人们的生活习惯。然而由于网络的飞速发展导致了信息量的膨胀,如何给用户提供有用的信息成为了一个研究热点,推荐系统也应运而生。基于内容的推荐系统利用物品本身的特征形成推荐,然而特征的表示有很大的语义鸿沟。协同过滤推荐系统利用用户的行为和兴趣分析用户间的相似度,综合考虑这些相似用户对于物品的评价来形成对原用户的推荐信息,然而由于现实应用中用户数据的稀疏性导致了相似度计算不准确和协同推荐系统的冷启动问题从而使得推荐结果也不够理想。如何解决语义鸿沟、数据稀疏性带来的问题和系统的冷启动问题成为了推荐算法研究的热点和重点。近年来,随着Twitter, Douban, Facebook等社区产品的发展和流行,网络中的用户可以用标签标注自己感兴趣的物品,用户之间也因为一些交互行为形成了丰富的关系。这些由交互行为形成的联系不仅反应了用户个人的兴趣爱好,也蕴含着用户与用户之间的关系。如何通过挖掘社会网络,语义标注等上下文的信息来协助推荐,从而达到改善推荐结果的目的,成为主动信息推送算法的新思路。本文的主要工作如下:1.为了解决协同过滤算法同冷启动问题,本文提出一种基于社区划分和协同标注的协同过滤算法,算法首先使用社区划分算法对用户所在的社会网络进行划分,提取出各个网络社区;然后通过构建基于用户、物品、标签的三部图模型来计算产生目标用户的候选标签集,最后利用三部图模型中的用户-物品模型和物品-标签模型来产生对用户的推荐。本文提出的算法基于社区划分和社会化标签,能很好地解决语义鸿沟的问题和协同过滤的冷启动问题。2.为了提高推荐系统的准确度,本文提出一种基于社会标注和动态兴趣建模的协同过滤算法。传统的协同过滤计算用户或物品间的相似度时,未考虑用户兴趣的转移,直接计算用户或物品的特征,从而降低了推荐系统的准确率。本文提出基于社会标注和动态兴趣建模的协同过滤算法,使用艾宾浩斯遗忘曲线重构用户-标签模型;通过社区划分提取出目标用户的候选标签集,最后利用三部图模型产生对用户的推荐。3.在以上算法研究的基础上,实现了基于社交网络的大学数字图书馆主动推荐系统。系统基于社交网络人人网,使用三层建模,利用Python和Flex技术搭建数字图书主动推荐平台。由于系统提供主动推荐服务,用户能够很好的享受读书阅读服务,在三个月内该平台的推广人数达到近2万人,排名人人网读书应用第三名。
其他文献
中文信息处理包括字处理、词处理、句处理和篇章处理三大内容,复句作为汉语语法的重要实体单位,其处理过程为中文信息处理的重要内容。“词处理”中汉语自动分词已有很大进展
在电力企业业务范围不断扩展、智能电网建设越来越迫切的情势下,如何依托公网实现移动终端与企业内网之间的安全通信和数据交换成为当前各大企业尤其是电力企业亟待解决的问题。远程接入通常涉及三个部分:接入终端、接入通道和内网应用,对这三个部分任一个保护的不到位都将给整个远程接入过程带来安全隐患。传统的基于虚拟专网的移动终端接入方案关注于安全传输通道的建立,虽然在一定程度上对数据安全传输提供了保证,但是缺乏对
作为一种新的计算模式,云计算以其方便、快捷、低成本等特性得到了广泛的研究和应用。与此同时,云计算也面临着来自多方面的挑战,而安全问题尤其重要。作为云计算的核心技术,
随着消费类数码相机的日益普及和网络多媒体信息的广泛传播,数字图像迅速产生和堆积。如何实现大规模图像数据的有效管理和查询,已经成为多媒体技术领域的重要研究课题。20世
20世纪末,个性化推荐首次给出了具体的概念。之后,各种推荐技术在近些年发展非常迅速。比如:信息检索、基于内容的推荐、基于关联规则的推荐、协同过滤技术以及混合推荐等等。其
  在信息化不断发展的时代,各企事业单位越来越依赖信息的沟通和数据的处理,信息系统支撑着它们的日常业务与工作,并逐渐成为运行的核心。在铁路车站中,随着作业信息化的加
  随着人们生活水平的不断提高以及计算机技术的快速发展,人们对图像与视频的使用要求越来越高,运用抠图技术,可以减少大量的拍摄费用,也可产生超现实的视觉效果。随着研究的深
  信息化时代的到来使信息量爆炸式增长,产生了针对海量数据集的知识发现理论(knowledge Discovery in Database,KDD),基于粗糙集的属性约简就是其中的重要内容。它尽可能
图像局部不变特征提取是计算机视觉领域中的一个基本问题。局部不变特征提取大致分成两个步骤:首先利用局部不变特征检测方法在图像上检测特征点位置、尺度等相关信息,然后根
医疗影像为医生诊断疾病提供了重要的依据,并且随着时间的积累和医疗影像设备种类和数目的日益增多,医院已经积累了大量的医疗影像数据。医疗影像数据种类多,数据格式差异性