论文部分内容阅读
随着网络应用的普及,网上信息量以惊人的速度增长,并且更新频繁。人们面对的问题不再是缺乏有用的信息,而是如何找到自己需要的信息。传统的通用信息检索技术满足了人们的一定需要,但其通用的性质,不能满足不同背景、不同目的和不同时期的查询请求,仍然面临查准率和查全率较低的问题。于是,个性化信息检索越来越成为信息检索领域研究的热点。个性化信息检索是一种能够满足用户个体需要的信息服务方式,它通过研究用户的背景知识和行为习惯,向不同的用户返回不同的信息,即在通过用户模型对用户的模拟的基础上,为用户提供针对性的信息服务。目前,虽然有很多这方面的研究,但是要真正完全地符合个性化需求并非易事,迄今为止,还没有一个成熟的个性化检索系统投入使用。用户模型在个性化信息检索中起着关键作用。通过对国内外个性化信息服务和用户建模领域的研究发现:现有的个性化信息服务中,用户模型的构建理论可分为基于统计的和基于语义的两种。基于统计概率和推理建立的用户模型本身是符合对用户兴趣的发现过程的,但随着语义网的发展,这种基于统计的用户模型在语义的表达上显示出不足;基于语义的用户模型将用户兴趣从基于关键词的层面提升到了基于知识的层面,把关键词通过语义联系了起来,对用户兴趣的描述更深入,却又忽略了兴趣变量值的概率分布。这使得两者在描述用户兴趣时都表现出片面性,不够准确和贴切。本文利用基于统计的用户建模和基于语义的用户建模优缺点互补的特性,在基于统计的贝叶斯网络用户模型的基础上,通过引入语义互信息,提出了用于个性化信息检索的基于贝叶斯网络和互信息的用户模型BMB_PRUM。在对相关理论介绍的基础上,首先,给出了BMB_PRUM的结构和形式化描述;其次,对BMB_PRUM的构建过程作了详细地说明,包括初始化算法和动态用户兴趣的提取及BMB_PRUM的学习更新;然后,介绍了如何使用BMB_PRUM来实现个性化检索:最后,通过模拟实验,验证了BMB_PRUM的有效性。本文的研究在实现个性化信息检索方面是有益的探索,BMB_PRUM在改善查询的查准率和查全率方面起到了积极的作用。