论文部分内容阅读
热带气旋(TC)的路径很大程度上决定了TC的影响区域及TC的影响范围。TC频数的高低直接影响到国家沿海经济带的经济建设、社会的发展以及人民群众的生命财产安全。而TC的活动是一种非常复杂的自然现象,因此对于TC活动规律的研究一直都是气象学界的热点问题之一。基于TC路径数据集及气候信号数据集的挖掘,不仅能发现TC频数与人们已知气候信号之间的关系,更重要的是为人类的生活生产,国家社会的建设提供更为有利的保障和支持。本文将利用数据挖掘技术对历史上登陆中国的TC路径进行分类,并基于诸多人们已知的气候信号利用分类与预测算法中的两种决策树算法对每一类路径的TC频数进行了分类与预测并产生了科学、简单、直观的分类规则集,更好地揭示各类路径的TC频数与人们已知气候信号之间的关系,也为预测TC频数提供了新思路。具体而言,本文从以下三个方面进行了探索和研究:1.本文深入地了解了目前热带气旋研究领域的热点和难点,从数据挖掘的角度出发,设计了登陆中国TC路径分类模型以及各类路径TC频数的分类与预测模型。通过对数据挖掘中聚类算法以及分类与预测算法知识的深入学习,选取了适合TC路径分类问题的算法即FMM算法进行模型的建立;以及适合TC频数分类与预测的两种决策树算法:CART算法和C4.5算法,利用这两种算法分别对各类路径的TC频数进行模型的构建以及验证。发挥了气象学,数据挖掘,计算机科学交叉学科的优势。2.本文利用聚类算法对登陆中国的TC路径进行了相对客观的划分。通过对K-means算法以及FMM算法两类常被学者们用来划分TC路径的聚类算法原理的学习研究和对比,本文认为FMM算法对于TC路径的分类更加的科学,。基于经验观察法,将历史上登陆中国的TC路径分为三类,并对每一类路径夏秋季和夏季的频数和生命史等特征进行了分析,发现了每一类登陆中国的TC生命史分布都各有特点。但是各类TC频数年际变化复杂,难以直观发现规律。3.为了解决上述问题,本文尝试利用CART算法和C4.5算法通过多种夏季的气候信号数据对夏季各类路径TC频数是否偏多分别进行了分类与预测,取得了较好的分类与预测效果,并且生成了简单易懂,科学有效的规则集,方便人们直观获取TC频数与气候信号之间的规律。以上工作不仅丰富了热带气旋领域的研究,也为数据挖掘和气象领域的科研问题结合提供了新思路。