论文部分内容阅读
Web2.0的出现掀起了互联网应用的革命,长尾理论取代80/20法则成为了指导互联网发展的理论基础。Web2.0在许多方面与Web1.0有着很大的不同,更注重和强调“以用户为中心”的概念。如何抓住用户的兴趣并为用户提供有针对性的个性化服务是Web2.0致力于追求的目标。因此,有必要针对Web2.0下的个性化服务进行研究和应用分析。本文首先介绍了Web2.0的概念和产生背景,分析了它与Web1.0之间的区别。随后,借助Web2.0的理论基础——长尾理论,分析了Web2.0所面临的挑战——如何给用户提供有针对性的个性化服务以提高用户体验。针对这一挑战,本文引入了数据挖掘中的聚类技术对Web2.0的个性化服务特性进行了建模。本文通过分析比较Web1.0下的各种建模方法存在的局限性,并参考Web数据分析的特点,针对性地提出了Web2.0用户聚类建模的方法。该建模方法本质上是一个抽象的建模方法,在本文中,该建模方法的聚类算法选用用了K-Means算法。随后,本文通过数学证明首先从理论上肯定了聚类算法相对于统计建模方法的优越性。同时,本文还针对[RaeOnoMue01]和[MikRaeWesSchMue99]标准数据集设计了实验分析验证,以此进一步验证了本文的建模方法在建模质量方面的优势。为进一步说明所提出的Web2.0用户聚类建模方法的特点。本文进一步对该建模方法的应用做了深入的研究。把实现该建模方法的模块嵌入到一个播客系统中,并基于该分析机制实现了播客系统节目的个性化推荐功能。在该应用场景中采用全局推荐机制作为参照对象,分析比较了以用户聚类建模为基础的个性化推荐与全局推荐对用户推荐的推荐质量。通过该个性化推荐应用中的一个实例再次直观地展示了基于用户聚类建模的个性化推荐的优点。最后,本文还对建模方法的应用改进作了进一步的探索。