论文部分内容阅读
进入21世纪,计算机技术尤其是网络技术得到了快速的发展,人们生活的条件和社会的环境也发生了巨大的变化,信息技术带我们进入了一个全新的信息社会。但由于Web页面过于复杂,无结构而且是动态的,导致用户难以快速方便地在网上找到真正感兴趣并且是需要的信息,“数据丰富但知识贫乏”的问题普遍且严重。针对当前的问题,个性化的信息推送服务就产生了,和传统的人找信息不同,它提供给用户了一种新的服务模式以解决“信息爆炸(过载)”的问题。重要指出的是,用户模型构建、更新和学习技术、网站自适应技术等都是信息推送服务中的重要技术,而信息推送系统中的基础和核心就是用户兴趣模型的相关技术。本文结合当前网络热门工具——微博的特点,介绍几种常用的反馈技术,重点讨论了Rocchio反馈技术相关理论,之后对模型学习及更新的方法做了重点讨论。微博用户的兴趣会随着时间、环境不断变化着。介绍了基于向量空间模型(VSM)的用户兴趣模型表示等方法并通过增加长期和短期兴趣各自的标识以及用户感兴趣的内容最近一次被更新的时间等方法对之进行改进,同时还对关键词权重的计算方法进行了相应的改进,然后详细介绍长短期兴趣分别采用的各自不同的更新方法。提出了结合Rocchio方法和渐进遗忘的方法更新长期兴趣模型的算法,对于短期兴趣模型,采用的是另外一种方法:滑动时间窗口的方法,同时,考虑短期兴趣在满足一定条件之后可能会转变为长期兴趣,提出混合的模型更新学习方法,使该更新学习方法能够很准确并且非常高效地追踪用户兴趣的各种变化。本文将理论研究成果应用到一个具体的信息推送服务系统中去,给出了系统的总体设计方案,划分为三个主要层次并对几个核心的功能模块的实现过程进行了详细的描述。通过对系统进行的两个实验:不同兴趣模型更新学习技术的性能对比实验和不同类型用户使用系统的实验结果分析实验。采用信息检索中的评价指标验证了所提出的理论和方法的正确性和可行性。