基于Kruskal算法改进的K-means聚类和用户兴趣变化的推荐系统研究

被引量 : 2次 | 上传用户:chrisdc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术和互联网的快速发展促进了信息资源的急剧增长,从而出现了严重的信息过载问题,致使用户会耗费大量时间从海量信息中找到自己需要的信息。而推荐系统的出现有效缓解了信息过载问题,并能够根据用户的需要为其提供个性化的推荐。但推荐系统又普遍存在着冷启动、数据稀疏性和实时性等问题,这些问题严重的影响了推荐系统的推荐质量。如何有效的解决上述问题,成为了推荐系统当下研究的热点,也是本文主要的研究方向。首先,本文以推荐系统为基础,研究了个性化推荐算法及其相关技术,并进行了比较分析。针对推荐系统中的用户-项目评分矩阵稀疏性问题,本文采用了一种改进的基于项目评分预测的填充算法对原始评分矩阵进行了预填充,解决了数据稀疏性问题;为了提高推荐系统的实时性,本文使用了聚类技术,并详细介绍了传统的K-means聚类算法理论及实现,分析了该算法的优缺点,而针对传统的K-means聚类算法对初始聚类中心敏感的问题(随机选择初始聚类中心可能造成只能得到局部最优解情况的发生),本文提出了利用克鲁斯卡尔(Kruskal)算法通过构造最小生成树(MST)的方法,实现了自动生成均匀分布的初始聚类中心,从而解决了传统K-means算法的这一问题。最后结合改进的K-means算法对填充后的评分矩阵进行了离线聚类处理,有效提高了推荐系统的实时性。其次,考虑到随着时间的推移,用户的兴趣可能会随之改变。本文假设用户对项目最近的评分更能体现用户当前的兴趣,而用户的评分时间越接近则认为其相似度越高。在通过基于用户或基于项目的协同过滤算法计算相似度时,根据时间效用函数对不同的评分分配不同的效用值,以提高相似邻居的准确性,同时该算法还解决了物品冷启动和用户冷启动问题,从而最终提高了推荐结果的准确度。最后,为了验证本文所提算法的有效性,分别对本文所提算法和传统的协同过滤算法进行了分析和对比实验,实验结果表明本文所提算法的推荐质量明显优于传统算法。
其他文献
<正>在西方艺术史上,宗教艺术占有非常重要的地位,甚至在中世纪,一切艺术形式都是为宗教服务的。因此,要辨析所谓"宗教绘画"与"以宗教为题材的绘画"之间的异同,首先
本文以放置在上海城市公共空间的雕塑作品为研究对象,在现场考察的基础上,通过大量案例描述和阐释,探讨上海城市雕塑的不同内容的文化指涉、形式意义及其对于空间场所的功能
企业的持续发展是企业永远追求的目标,而员工职业规划是对个人职业发展的远景规划和资源配置,两者是息息相关,密不可分的。本文分析了企业发展与员工职业规划的关系,亦重点从
航运公司为了确保人员、船舶、货物以及对环境的安全,建立了《风险识别、评价和控制管理程序》,对一切风险源进行预先辨识、评估、控制和操作,提高防范、控制意识。旨在提供
在"后WTO"时代,继续承接服务供应全球化趋势,从"中国制造"向"中国服务"转变,商务会展服务外包市场是一个新的经济增长点。旅游服务业外包业务的出现和成长是旅游市场需求和企
李斯作为秦朝政变的核心人物 ,他的思想与秦朝的命运息息相关。李斯的功利观源自于法家的人性理论 ,而“帝王之术”是法家人性理论的具体体现 ,通过研究“术治”理论及李斯坎
绩效评估对于每一个企业而言都是极其重要的,对于政府部门也是如此。地方政府绩效评估的方法有很多,但都存在这样或那样的缺陷,尤其是这些评估方式都不能发掘问题的潜在原因
审视国际师范教育价值观的嬗变走势,反思我国师范教育的改革历程,因应我国中小学素质教育对教师素质的更高期待,通过不懈的思考与探索构建新型的师范生素质教育体系是我国师范教
针对航运业减少温室气体排放这一国际海事组织内部目前讨论的热点问题,分析了航运业减少温室气体排放的现行国际法律框架、已提出的减排方案、国际法的新动向(欧盟对航运业减
本文研究了湖北省五峰县后河自然保护区光叶珙桐种群结构及其动态。结果表明,光叶珙桐种群径级分布呈倒金字塔型,存活曲线呈双峰凸型,说明光叶珙桐种群更新不良,年龄结构属于