论文部分内容阅读
相关研究显示,高学历网民在社交网站使用率中所占的比例呈逐年下降的趋势,其最主要原因是,社交网站浪费时间、缺乏专业性。为了满足高学历网民的需求,学术社交网站(为进行学术交流活动建立的社交网站)的数量在快速的增加。然而随着网络的迅猛发展,科技论文的数量也在以每年6%-8%的速率进行增长,科技论文信息量的剧增加大了论文检索的难度,进而导致论文共享中被动服务的问题,即用户无法主动地快速检索感兴趣的科技论文。本文针对学术社交网站中科技论文共享被动服务的问题,提出并实现了一种将社交网络特性和传统个性化推荐算法相结合的论文混合推荐算法,此算法可以主动的向用户推送其感兴趣的科技论文。本文首先深入研究了传统个性化推荐技术,包括基于内容过滤的推荐算法、协同过滤算法、关联规则算法以及混合推荐算法。而后研究了基于社区发现的个性化推荐技术,包括基于图论的算法和层次聚类的算法。在此基础上,指出了传统个性化推荐算法的缺点,并分析了将社区发现算法与传统个性化推荐算法相结合的可行性。继而提出GN-AP混合推荐算法,即将经典社区发现算法——GN算法和关联规则算法一-Apriori算法相结合的混合算法。该混合推荐算法可分为三大部分:首先运用GN算法构建兴趣相似用户群,其次运用Apriori算法进行论文关联规则挖掘继而实现首次论文推荐,最后引入论文兴趣度论文推荐。在提出了混合推荐算法的基础上,对其进行绝对性能和相对性能两个方面的分析,在绝对性能上,根据准确率和召回率两个标准对论文推荐结果进行评价与分析;在相对性能上是将基于Apriori的论文推荐和混合算法的论文推荐进行对比分析。通过实验结果分析,本文基于社区发现和关联规则的论文混合推荐算法能有效地提高论文推荐的准确度。验证了混合推荐算法的有效性后,本文设计并实现了一个论文个性化推荐系统。此系统可以主动地向用户推送其感兴趣的论文,从而节约了用户检索论文的时间,获得了更好的用户体检。