论文部分内容阅读
人们的生活和气象预报有着密不可分的关系,实时而准确的天气预报非常重要。随着气象观测技术的进步、探测仪器的精准化和数据存储技术的发展,获得了海量的复杂的多维气象数据。从这些数据中准确高效的分析所蕴含的规律是一个巨大的挑战。另一方面,一个高性能的气象预报发布平台是不可或缺的,能及时的将气象信息传递给用户。本文的数据来自于广东省佛山市自动气象站气象数据,以C4.5决策树算法为研究对象,并且结合组合算法构建组合降雨预测模型,对多维气象数据进行准确的分类,并且实现了气象信息预报发布平台。具体如下:(1)基于决策树算法,对决策树算法的基本概念、类别、实现过程和性能评价进行详细的介绍。对C4.5决策树做出两点改进:针对C4.5决策树算法在处理多维数据分类,没有考虑属性对分类结果的影响,导致的分类准确率低的问题,提出了基于距离权值的C4.5算法。针对叶子节点含有的最小样本数对生成决策树的影响不同的问题,设置叶子节点的最小样本数为最佳值,构建最佳分类模型。(2)介绍组合算法的概念、分类,尤其详细介绍了 Bagging和AdaBoost算法的实现过程。利用C4.5算法和基于距离权值的C4.5算法训练多个基础分类器,并且通过Bagging和AdaBoost算法构建组合决策树,实验证明,组合决策树在处理多维数据时有较高的准确性和稳定性。(3)针对自动气象站的气象数据搭建降雨分类模型,利用分类模型进行降雨预测,搭建气象预报发布平台。介绍了平台的设计目标、总体设计架构和模块功能等。本论文采用基于MVVM(控制器-模型-视图)开发模式的Vue.js框架,利用JavaScript等前端技术实现气象预报发布平台的搭建。