论文部分内容阅读
随着移动通信网络的飞速发展,移动设备数目激增,业务种类繁多,用户的服务质量需求也随之提高。对用户网络业务行为的精准刻画有助于为用户提供定制化的服务,同时为网络优化也提供了有用信息。但移动用户的业务流量数据随时间、空间波动严重,且不同用户个体差异性大,使得传统的时间序列预测算法无法直接适用于个人用户的网络业务流量预测。本文基于机器学习方法,针对用户网络业务流量预测问题进行了分析与研究,具体研究内容包括以下四个方面。用户流量时域分布规律研究以及用户行为分析。对原始数据进行预处理及聚合求和后,得到了时域的统计分布规律,研究了整个网络的周期性及自相关性特点。然后分别分析研究了用户流量使用特征、用户访问手机应用软件特征以及用户移动性。分析发现用户使用流量行为存在极为明显的长尾效应,同时发现用户移动性对用户业务流量数据及用户应用使用行为有很大的影响。高移动性用户倾向于使用更多流量,并访问更多手机应用软件。用户业务流量数据聚类。应用因子分析法对用户业务流量时间序列进行特征提取并降维,提取出五个分别代表五个特定时间段的公共因子。应用k均值聚类算法对因子分析法降维后的特征向量进行了聚类分析,根据用户使用流量时域特征,挖掘用户之间的相似性,将用户分成六种类型,为运营商提供一种更加合理的专属计费方式,即根据不同类型的用户使用流量的时间分布制定策略。基于因子分析法的k均值聚类算法对用户聚类效果更好且特征可解释性更强。基于用户手机应用软件行为聚类,挖掘用户应用行为与用户业务流量数据之间的相关性。对用户使用手机应用软件的行为进行了重点分析,应用潜在语义分析提取特征并降维,然后用k均值对用户进行聚类,将用户分为六种不同类型。分析不同类型用户使用手机应用软件行为与其对应的使用流量的行为,结果发现,用户使用流量的行为与其使用手机应用软件行为紧密联系。因此手机应用软件使用行为对预测用户使用流量很有帮助。用户业务流量预测算法研究。从单个用户角度出发,只使用用户本身的时间序列流量数据进行预测。针对个人用户业务流量非平稳、数据突变性强等特点,提出一种基于小波变换的Prophet与高斯过程回归预测算法。小波变换可将原始用户业务流量时间序列分解为高低频子序列,再根据子序列的特点,分别应用高斯过程回归算法与Prophet算法进行预测。使用平均绝对百分误差作为评估指标,对比传统的时间序列预测算法如自回归积分滑动平均模型,提出的方案能将预测误差降低一半。