论文部分内容阅读
在过去的十几年中,信息技术得到了飞速的发展,如今互联网早已普及,并已经深入到社会的各个角落。但与此同时信息科技也带来了网络上数据量的爆炸性增长,用户面对海量的数据资源时不得不耗费大量的时间以及精力去获取有用的信息。在这种情况下,如何能够使人们更加快速、准确地获取有用的信息已经成为了越来越多信息技术领域学者的研究重点。而推荐系统作为一种有效的信息过滤技术和个性化服务工具,已被证明是一种解决网络上“信息超载”问题的有效手段,并得到了广泛的关注和深入的研究。目前面向个体用户进行推荐的个体推荐系统的研究已经比较成熟。近十年间也有不少学者开始从个体推荐系统出发,开始着眼于能满足群体共同活动需求的群体推荐系统的研究和开发,并在该领域取得了一定的研究成果。但群体推荐技术并不能仅仅依靠对个体推荐技术的简单叠加,很多在个体推荐领域比较成熟的方法也难以直接推广到群体推荐领域。同时由于群体推荐远比个体推荐复杂,群体推荐中要考虑的信息要远多于个体推荐,群体推荐也比个体推荐面临着更多的问题,造成了在算法复杂性方面群体推荐的算法复杂性要远远高于个体推荐。目前已有的一些群体推荐系统并没有充分考虑这些问题,因此尚需要进一步研究以提高群体推荐系统的效率和推荐精度。因此,本文结合符号数据分析法提出了一种新的群体推荐算法。在该算法中,我们使用了模态型符号数据把群体作为一个整体建立了群体模型,在群体模型建立之后将其当作群体中的一个特殊的虚拟的个体,并使用在个体推荐领域已经比较成熟的协同过滤技术进行推荐产生最终的推荐结果。其中,群体模型的建立过程是最核心的内容。为了使群体模型能最好地表达个体的偏好,群体中所有个体模型到该群体模型的距离之和应尽量小。这样,群体建模的过程就被转化成了一个最优化求解问题,我们使用了遗传算法来求解该最优化问题。实验部分使用了Movielens数据库进行了3组实验来考察本文提出的算法。实验的结果表明,使用该算法建立的群体模型能够反映群体中不同用户的偏好差异,因此,在其基础上进行的群体推荐是符合逻辑的并且有意义的。本文提出的群体推荐算法的推荐精度要优于实验中选用的其他四种对比算法,并且这种差异具有显著性。敏感性分析的实验结果表明本文提出的算法在群体内成员偏好差异度较小且有充足的信息用来建模时具有最高的推荐精确度,同时无论这两个因素如何变化,本文提出的算法推荐精确度均优于对比算法。