基于用户聚类的服装推荐算法研究

来源 :武汉纺织大学 | 被引量 : 0次 | 上传用户:zxcvbnm123444
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着21世纪的到来,市场上出现了以淘宝和亚马逊为代表的一些电商平台,这些平台为消费者提供了极大购物便利的同时,也出现了很多因为数据过大而导致的一系列问题,例如数据量过大,导致聚类算法效率低下,不能及时给用户推荐产品,同时数据量过大,导致数据稀疏性问题明显。对于这些问题,本文研究了基于用户聚类的服装推荐技术。基于传统协同过滤算法中,由于其本身特性造成的推荐效果实时性不高以及效率低下的问题,引入用户兴趣变化模型,以及评分预测时间模型,提出基于时间和用户兴趣改变的协同过滤推荐算法,对传统过滤算法进行针对性的修改。本文中,通过对KNN算法的研究,对其优缺点进行针对性的改进。论文主要的工作内容包括:
  一、对推荐系统进行深入的研究,深入了解其概念,理论,在此基础上详细的介绍了现今比较流行推荐系统的特征,比较了他们之间的不同以及个自的优缺点。在这样的条件下,着重对协同过滤推荐算法进行了全方面而且详细的分析。
  二、考虑到用户在随着时间的推移,兴趣爱好等会改变的问题,本文通过为传统的协同推荐系统引入时间因子,以时间数据权重模型为切入点,对适用于用户兴趣变化的模型进行改进和研究以应对传统协同过滤算法在推荐过程的实际情况,满足用户所需。针对用户兴趣模型难以确定的情况下,本文通过提出基于时间模型的评分预测函数,为了解决因为数据量导致的稀疏问题,通过对数据预先处理以及通过相似度函数来解决传统协同过滤算法中由于缺乏时间因子所带来的的预测不准的问题。
  三、在对传统的KNN算法进行深入的研究之后,知晓KNN算法在海量数据分类时效率低下的问题,我们创新的提出了一种基于有效密度裁剪的KNN改进算法。这种算法在通过聚类过程中的样本进行噪声数据剔除处理,而且再通过对密度的裁剪以提高KNN算法的分类效率,与此同时还会保证分类的精准度。
其他文献
大智移云时代背景下,不断涌现的大数据、移动互联网等新技术,给企业成本管理带来了新一轮的信息技术革命。在此时代背景下,企业成本管理发生了重要变革,朝着数字化转型。然而,在实际的管理过程中,仍然存在着企业领导的成本管理意识不强、成本费用无法得到很好的控制以及成本监督机制不完善的问题。以某房地产企业为出发点,从建立领导对成本管理的新认知、加大成本控制力度、建立科学的成本管
大数据、云计算技术广泛应用于各行业,服务器作为大数据、云平台的主要基础硬件承载设备,其稳定运行将直接关系云平台上承载的各类应用系统的可用性,对用户的使用体验带来极大影响。本文根据定制化的集群服务器机房相关设备故障监测需求,基于机器学习算法理论,应用了服务器故障检测算法框架,通过采集的数据对算法进行了相关测试。本文的主要研究内容如下:(1)机器学习算法设计与应用:针对
异质性的存在是空间经济学的发展基础,以集聚理论为核心,如何更好地解释经济活动在空间的不均匀分布成为了该学科的研究重点。空间类分与空间选择作为集聚理论的最新前沿,从全新的视角对经济活动在空间的不均匀分布进行了解释。为了全面理解类分和选择的理论和现实意义,本文首先通过对国外学者在此方面研究的文献梳理,总结归纳出空间类分和空间选择的内涵以及产生机制:空间类分以互补性和事前
地下储气库(以下简称储气库)设计注采运行30~50年,安全问题是储气库注采运行的重中之重。为保障储气库长期安全平稳运行,除常规监测手段外,微地震实时监测技术是储气库断层、盖层、储层及井筒监测的有效手段。新疆H储气库是国内最大陆相储气库,断裂较多,砂体变化较快,针对不同观测系统,采用微地震实时监测系统可论证监测范围、最小震级、定位精度等,在此基础上优选最优的微地震监测
组合优化问题(Combinatorial Optimization Problems, COPs)在诸多领域具有广泛的实际应用。然而目前大多数组合优化问题(COPs)问题为NP难度问题,它还没有方法能在多项式时间内得到其最优解。实践表明,启发式算法能够在合理的时间内找到其近似解。然而随着问题规模的扩大,启发式算法的计算时间随之增加,随着可用数据的增加,问题的规模也在不断扩大。因此,开发设计高效的启
非接触式生命体征监测雷达技术作为生物医学传感领域与现代雷达领域的交叉研究热点,近二十年来得到了迅猛的发展。美国、德国、日本等发达国家非常重视该技术的发展,相关高校与企业致力于该技术在临床医学与家庭保健方面的推广。与传统的接触式生命体征传感器相比,该技术具有非接触式测量的特点,适用于长时间监测与特殊病人(如烧伤病人)监测~([1]);与其他非接触式的传感器(如视频传感
随着仿生学研究的不断进步,鱼类游动为水下航行器的推进方式提供了新的思路,研究鱼类的游动机制、探寻其与流场间的作用机理,对研制新概念的水下仿生机器人具有重要的指导意义。近年来,数值模拟方法已发展成为重要的科学研究手段,但基于数值模拟方法研究鱼类的游动机理依然处于起步阶段。本文针对鱼类游动模拟所面临的可用性差、效率低、应用不广泛等问题,深入开展了面向鱼类游动的并行数值模拟关键技术研究,主要创新点包括:
学位
云计算可以为用户带来无穷的计算资源和诸多服务,用户可以像获取水电和煤气一样自由的按需获取这些资源和服务。数据中心作为云计算的根基,是云计算中数据传输、计算以及存储的中心。随着云计算的快速发展和普及,数据中心的规模和复杂度也日益增长,如何有效的动态管理资源成为数据中心所面临的新挑战。  目前,云数据中心内普遍存在负载不均衡和资源利用率低的问题。云计算服务的提供者需要考虑如何合理的将虚拟机放置在物理机
织物的悬垂性能是织物视觉风格和美学舒适性的重要方面,它与织物自身的结构参数、力学性能有着密切的关系。目前,研究织物悬垂性能的方法很多,一般采用的方法是首先对织物的悬垂性能进行参数测量,然后定量地分析各个参数对其产生的影响,有些研究人员从中提炼归纳出了一个非常具有研究意义的指标——悬垂因子,借助于这个综合指标来对织物悬垂性的优劣做出评价。本文在这些研究人员所做的研究基础上,将基于粒子群的聚类算法和局
学位
采用湿法纤维缠绕工艺制备不同参数的玻璃纤维缠绕筒体,研究了缠绕张力对不同内衬管径和缠绕角度不同的缠绕筒体树脂含量及力学性能的影响。结果表明:缠绕张力与缠绕筒体树脂含量呈现出单调递减的趋势;缠绕张力相同条件下,随着内衬管径增加、缠绕角度减小,缠绕筒体的树脂含量逐渐增加;环向缠绕的试样有着更加稳定的能量吸收特性;缠绕张力对NOL环拉伸强度的影响规律呈现出二次曲线关系,当