论文部分内容阅读
随着Web2.0的飞速发展,互联网用户已达数以亿计的规模,不同的用户具有的用户特征也千差万别,如何根据用户特征预测用户的兴趣,在互联网众多繁杂的资源中为用户推荐其感兴趣或者潜在需要的信息,显然成为当前所研究的热点方向。本文正是以此方向作为立意点,从用户特征的角度对推荐算法进行相关的研究。首先,针对用户在对资源选择偏好的时间效应特征,本文提出了一种融合物质扩散热传导和时间效应的推荐算法;其次,针对用户的标签特征和用户个体的重要程度,本文提出一种基于多标签聚类和核心用户的推荐算法;最后,以上述两种算法作为理论基础,设计并实现了新闻推荐原型系统。本文所研究的主要工作包括以下三个方面:(1)研究用户对资源选择的时间效应特征,提出一种融合物质扩散热传导和时间效应的推荐算法。首先,将基于二分网络基础的物质扩散推荐算法和热传导推荐算法混合使用,然后在此基础上,分析了用户对资源选择的时间效应特征,主要受近期选择资源的影响,同时用户原先的兴趣也会有一定的保留,从而分别引入两个调节因子增加用户对资源选择偏好的时间效应。该算法在推荐的准确性和多样性方面都有显著的提高,说明利用该方法进行推荐可以有效的提升推荐性能。(2)研究用户的标签特征和用户个体的重要程度,提出一种基于多标签聚类和核心用户的推荐算法。首先,充分考虑用户个体的重要程度,先利用密度峰值聚类算法对用户标签进行聚类,然后研究用户间和标签间的潜在关系,初次定义用户与标签类簇关联度和用户位置权重概念,提出一种基于多标签聚类的核心用户确定方法,然后在此基础上,基于物质扩散和热传导的混合推荐算法提出一种基于多标签聚类和核心用户的推荐算法,在推荐的准确性和多样性方面也有较为明显的提升。(3)设计并实现了基于用户特征的新闻推荐原型系统。利用上述两种算法作为新闻推荐原型系统的理论基础,首先分析并设计系统相应的功能模块,然后实现基于用户特征的新闻推荐原型系统。该系统可以通过用户的特征来发掘用户的兴趣,进而便于用户发现其感兴趣或潜在需要的新闻信息。