论文部分内容阅读
互联网技术飞速发展的当下,视频多样性服务也大量涌现,用户对于视频质量的需求也随之增长。为了更好地服务用户,提升用户体验,服务商致力于研究各方面指标以改善用户体验质量(QoE)。因此,如何通过调整、权衡各指标来预测QoE成为了当下的研究热点。本文从数据分析、建模预测的角度出发,展开了一系列研究。本文首先进行了数据搜集、数据预处理等前期准备工作,从而获得了大量与视频相关的指标数据。为了对可能影响QoE的因素进行分析,本文进行了数据清洗、离散化、统计分析等工作,从而筛选出合适的影响因素。通过对比多种经典机器学习算法,选取决策树模型对QoE进行建模预测。具体而言,本文的主要研究工作有如下三点:首先,在利用信息增益进行相关性分析时,采用信息增益最大化方法对连续型数据进行离散化处理,并对现有快速离散算法进行改进。通过对含有重复值的特征数据进行重新整合归类,使快速离散算法能适用于任何类型的数据集,提高了离散化的准确率。与此同时将改进快速算法运用到构建树时的二分离散中,加快了建树速度,又达到了与原树相同的预测效果。其次,为了精简C4.5决策树模型,对停止条件进行了改进。通过将模型复杂度与准确率权衡比较,共同决定待分裂子集数据量的最小值,使决策树在保证一定准确率的前提下达到最精简模式。通过实验验证这样改进会使得模型的复杂度、算法耗时大大降低,从而能够适应更庞大的数据量。最后,针对决策树建模过程中的特征选取准则进行了改进。通过引入特征离散度指标,与原始信息增益率指标相结合,综合考虑数据本身的离散程度和分布情况,构建新的选取标准。通过实验证明新的选取标准使得特征选取更为准确,同时可以提高决策树模型的预测准确率。本文最后通过与其他模型进行对比,对改进模型准确率、复杂度、耗时等多方面进行测试,验证了所设计方案的性能以及改进算法在QoE预测准确性方面的提升效果。