XGBoost算法在智能家电销售额预测的应用

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:zldingkai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据和云计算的不断发展,智能制造将成为未来制造业发展的主题方向。越来越多的传统制造业企业注重设备之间的互联和数据分析,通过将自身的传统信息技术与互联网、大数据相结合,推动企业各个方面智能化发展,让企业在市场上处于领跑地位。在传统的家电领域中,不仅要使家电产品自身智能化,而且也要把智能知识不断融入到家电产品的生产和销售过程中,从而实现制造过程智能化和销售过程智能化,提高家电产品的质量。随着智能化家电在市场上越来越受欢迎,很多家电企业产生了海量数据。可以通过大数据平台对海量的家电数据进行存储、分类、预测和分析,挖掘家电数据的潜在价值,从而激发家电行业的市场潜力。本文主要内容如下:(1)本文的研究对象是美的企业家电专卖店的销售数据和专卖店信息数据,针对日益增长的智能家电数据,使用Hadoop平台对大量家电数据进行存储,由于Hadoop平台下的Map Reduce计算框架处理迭代问题的能力较弱,通过在Hadoop平台上使用Spark计算框架对数据进行分布式计算,充分发挥Hadoop平台和Spark计算框架的优势,从而提高数据处理的运行效率。(2)针对智能家电数据信息的特点,对数据进行可视化操作,分析相关变量对智能家电销售额的影响,对数据的特征重要程度进行排序,构建良好的特征方程。同时介绍了线性回归、Light GBM与XGBoost等模型算法,在理论上对这些算法进行比较分析,单一的XGBoost模型在处理智能家电数据时具有比较大的优势。(3)为了提升XGBoost模型预测销售额的准确性和泛化能力,利用Stacking算法理论对XGBoost模型进行优化,将XGBoost和Light GBM模型进行融合,并在Stacking第二层的特征选择时,加入重要程度高的特征进行训练。实验结果表明,优化后的XGBoost模型的预测性能得到进一步的提升。同单一模型相比,优化后的XGBoost模型的准确性和泛化能力更好,可以更好的将预测结果反馈给企业的生产部门,提前做好相关产品的库存处理。
其他文献
心肌梗死是一类严重的心血管类疾病,其发病有易突发、病情险、易造成死亡和易引发相关病症等特征,心梗的预诊、早诊对患者的预防、治疗和预后具有重要意义。目前常见的使用心电图自动诊断技术进行心肌梗死辅助诊断的研究中往往存在需要定位的特征点多、除QRS波群外特征点定位精度不高、特征提取严重依赖特征点定位准确度、特征提取易忽略信号微弱特征、分类诊断性能不佳、院外预诊、助诊系统缺乏等问题。本文重点专注基于机器学
农业生产实现智能化对提升农业生产效率有着非常大的促进作用。高精度的农田场景数字化地图是实现植保智能化的关键,而农田场景的三维重建技术是实现农田地图数字化的重要研究。三维重建恢复出来的三维地图可以运用于植保无人机的自主导航作业、障碍物的识别、农作物长势识别、网格表面重建等任务。本文以视觉三维重建为研究背景,对基于农业测绘无人机高空拍摄到的农田数据集的三维稠密点云重建算法展开研究。首先,采用视觉SLA
人们对建筑环境日益增长的需求促进了建筑智能化和建筑自动化系统的快速发展,楼宇自动化和控制网络(BACnet)协议是楼宇自动化领域中使用最广泛的协议之一。为了满足更为迫切的互联互通需求,BACnet/IP协议在BACnet标准中定义了一个可选的且前景可观的安全性体系结构。随着BACnet/IP技术的应用,楼宇网络可以通过高速以太网实现更广泛更经济的异构网络互连。但在市场环境中,由于各大楼宇厂商往往倾
作为方便个人使用及保护隐私的手机配套产品,耳机已经成为人们日常生活中的通用电子产品。随着居民消费力的提高,消费者对耳机的数量及质量需求正逐步提高,这对耳机的生产质量及效率提出了新的要求。在耳机制造过程中,必须对耳机进行调音网纸的粘贴,以便后续工序对耳机的音质调节。当前工业现场调音网纸粘大多采取手工拾取粘贴。该方式因人工操作会导致调音网纸粘贴位置出现偏差,影响耳机调音孔透气量,进而影响耳机音质等级。
在旋转设备故障诊断领域,通常会遇到数据非均衡的问题,即故障数据的数量特别是灾难性故障数据或意外的机械故障很少,而正常状态数据的数量非常大。当常用的基于数据驱动的故障诊断方法对非均衡数据实现预测后,得到的是结果往往是多数类样本的预测精度很高,而少数类的精度则会很低,这样的预测能力将会产生致命的后果。比如在工业领域,如果将旋转设备的故障状态误诊为正常状态,则可能会造成严重的经济损失甚至人员伤亡。因此,
在这个计算机技术不断更新换代的时代,人们给计算机赋予了视觉的功能,用以代替人眼进行观测。未来几年机器视觉在工业领域的应用将会越来越广泛,尤其是耗费大量人力的人工检测流程,在工业领域使用机器视觉能够提升产品质量、提高检测速度等。在硅钢片焊缝缺陷检测流程中,采用人工检测的方式容易受到检测人员疲劳和身心健康的影响,同时人工检测比较耗时,每一次的检测标准又无法统一,因此使用自动化检测系统来代替人工检测已经
随着一批新产业新技术的发展,例如5g通信技术的兴起,对高品质注塑产品的需求也与日俱增。注塑业是标准的离散型制造业,完整的产业链包括原料的生产、运输、储存,再到注塑工厂生产成型件。而原料的质量是影响注塑成品质量的关键因素,所以加强对注塑原料质量检测是非常必要的。注塑原料的检测是一项系统的工作,检测手段包括目视、量测及试生产。其中目视主要针对注塑原料的表面缺陷及尺寸缺陷,但是传统的人工目视存在诸多缺点
在信息爆炸式激增的大数据时代,字典学习模型受到广泛地关注,且已被成功地应用于信号后续处理的各个领域,比如图像处理、图像融合、视频关键帧提取等。现有的字典学习算法主要基于0L稀疏范数、凸松弛1L稀疏范数约束字典学习模型。0L稀疏范数的不连续性会导致其优化求解极具复杂性。此外,由于1L稀疏范数是0L范数的凸松弛近似,其约束的字典学习存在稀疏度弱、估测值偏差较大等问题。因此,针对现有基于0L稀疏范数和1
网络化系统是计算机、通信和控制快速发展以及相互作用的产物,相比于传统的控制方案,网络化系统的模式结构更为复杂,空间分布更为广泛,性能更加优异。网络化系统是实时系统,主要分为被控对象、传感器、控制器和执行器四个部分,其信息传输通过网络建立连接。网络化系统具有成本低、安装和维护简单、可靠性高等优点,是其能够在多个领域广泛应用的重要因素。然而,通信网络的引入使得系统在信息交流过程中,通常会出现带宽受限、
当今信息化时代中,社会各个领域所产生的数据呈现井喷式增长,如何在海量且复杂的数据中挖掘出潜在具有价值的信息已经成为了一个相当热门的研究课题,Kmeans算法作为数据挖掘中常用的聚类算法,其算法原理简单且有着比较高效和准确的聚类效果,然而该算法在处理大规模数据时迭代速度较慢,同时初始聚簇中心选取也会对聚类结果产生较大影响;其次面对海量数据的挑战,单机运行的K-means算法也已经不能满足日益增长数据