论文部分内容阅读
随着Internet技术的快速发展,社会标注作为一种灵活、有效的分类方式,开始受到人们越来越多的关注。如何从海量的标签库中找到用户所需要的标签成为一个关键的研究问题。社会标签推荐系统的出现减少了用户的标注负担,在没有社会标签推荐系统的情况下,用户必须手工标注资源,很多时候用户很难确定哪个标签更合适,社会标签推荐系统根据已经有的标签,可以自动的提供一些与资源内容相关或者用户感兴趣的标签供用户选择,使得用户标注所需时间大减少,改善了用户体验。高效的标签推荐方法对于帮助用户方便地获取有用的标签具有重要意义。本文首先对现有Web2.0下的社会标签系统以及推荐原理作了介绍。其次对目前主要的标签推荐技术进行了分类整理,总结了它们各自的优缺点。发现目前大多数的标签推荐技术只考虑“资源-用户”两个维度,而标签推荐系统具有“资源-用户-标签”三个维度,所以本文通过分析“资源-用户-标签”三个维度的整体交互信息,推荐与用户需要最贴切的标签,达到对标签推荐技术优化的目的。本文主要是对Del.icio.us网站上已经打过标注的网页、标签、用户进行分析,提出一种新的基于内容的社会标签推荐方法—特征投票法(FVT)。为了研究及对比FVT方法推荐标签的质量,本文又分析了两种简单的推荐方法—关键词推荐法和TF-ISTF推荐法。最后采用了多种评价方法对推荐结果进行评估,实验结果表明本文提出的基于内容的标签推荐方法能够更好的满足用户对于推荐结果的期望,推荐结果比原来的方法更加准确,更加贴近于用户的需求。