论文部分内容阅读
近年来,伴随着科技的进步,互联网得到了迅猛发展,网络社交媒体快速地发展扩张,已经成为了生活中不可或缺的一环。人们希望在社交网络中认识更多的人,发现更多的乐趣。所以,根据用户特征并给其推荐好友是社交网站的工作重点,也是用户的潜在要求。但是在现在的社交网站中,用户获得好友的方法主要有用户自己手动添加、网站根据热门事件为用户推荐和仅根据用户最近的动态发现用户特征为其推荐。但是用户是个有性格的独特个体,有着固有的特征,社交网络显然忽略了这一点。由此可见,根据用户的特征提供个性化的推荐是社交网络的研究方向,也是可以显著提高用户体验的切入点。网易云音乐根据用户的习惯等特征发现用户的独特音乐DNA,从而带来了大量的用户就是一个很好的佐证。随着人们对好友推荐的研究,好友推荐领域出现了用户兴趣的主题模型,它可以将用户的兴趣分类,效果优于传统的基于内容的推荐。本文在此基础上,依托已有研究成果,从用户的兴趣分布和用户兴趣的产生变化过程入手,根据社交网络的特性,基于已存在的算法的不足,提出了一种可用于新用户的兴趣分布检验的算法和一种可用于兴趣迁移检验和新兴兴趣挖掘的兴趣挖掘算法。通过数据实验证明可以很好的预测用户兴趣的迁移。本文的主要工作和贡献如下:1.针对用户兴趣的特点,提出了一种改进的LDA主题模型,可以用于新用户的兴趣分布探究算法。2.针对现有的用户兴趣探索算法的不足,在这些算法基础上设计了一种改进的兴趣探索算法,该算法很好地发掘了用户的潜在兴趣,并且发现了用户的新兴兴趣。3.结合现有新浪微博的网页展示结构,利用现有的自然语言处理技术。设计了一种抓取微博用户数据的数据抓取工具和一个微博用户数据处理工具。这些工具可以获得可应用于主题分布实验的数据集合。4.通过获取的文本进行算法仿真模拟实验,通过实验证明,改进的算法可以很好地进行用户兴趣的预测和用户兴趣分布的探究。