论文部分内容阅读
在线社会媒体的流行性预测旨在利用在线系统中商品和用户的交互数据预测在线商品在未来一段时间的流行度。在线社会媒体的流行性预测研究在理论层面和现实社会中都有巨大的意义。理论层面上,流行性预测可以使帮助人们明白哪些因素可能导致商品的流行,商品流行性的动态演化以及微观行为如何汇聚到宏观的商品流行性;现实层面上,商品的流行性预测可以帮助在线用户更有效的过滤掉无用的信息,在线服务商更好的组织和管理他们的平台,以及为广告商提供策略指导等。传统的流行性预测方法大都是从宏观层面进行预测,然而,这类方法往往不能预测出那些当前虽然不流行但即将会流行的“潜力商品”,同时也不利于解释商品流行的原因。因此,本文综合分析了国内外流行性预测方法的研究现状,通过引入推荐算法和社交关系,提出了一些有效的解决方案。本文主要工作如下:1.结合流行度预测的基本工作流程,深入的分析了流行度预测方法中常用的评价指标;根据预测方法的不同思想,总结了常见的流行度预测算法,并指出了各类算法的应用场景及相关代表性算法的具体流程;最后详细的阐述了流行性预测算法的理论基础和算法的流程。2.本文将推荐算法引入到流行度的预测算法中,并提出了一种基于推荐的流行度预测算法框架。基于推荐的流行度预测算法首先是通过推荐算法从微观层面上发掘各个用户在未来一段时间可能感兴趣的商品,然后将不同的单个用户的潜在兴趣汇聚起来最后进行商品流行度的预测。所有的预测器的预测效果都通过三个来源于不同在线服务商的数据集(Movielens,Netflix和Digg)进行评估,实验结果表明,相比于传统的基于流行度的预测算法,本文提出的算法在预测流行商品和“潜力商品”的问题上都有更好的表现。此外,通过在Digg数据集上的分析说明,通过引入用户的影响力,预测算法的效果特别是针对”潜力商品”还可以得到明显地提高。3.本文提出了一种基于社交关系的流行性预测算法。该算法基于早期选择商品的用户之间社交关系数据,构建用户之间的社交网络,提取相应的社交网络特征来提高算法的预测准确率;接着,本文还首次定义并量化了能够促进商品传播的传播达人,并根据定义的传播达人,提取了相应的传播达人类特征,并将其加入到了基于社交关系的流行性预测算法中进行预测。本文在Digg数据集上进行了实验,实验结果表明,通过引入社交网络特征和传播达人特征,可以提高算法的预测效果。此外,通过对实验结果的分析,本文发现朋友之间的“人情性”投票不利于商品的流行,而文章定义的传播达人选择商品的次数与商品的最终流行度存在一定的相关性,以上结果也从不同用户的选择对商品流行度的影响的角度,解释了商品为什么会流行。