论文部分内容阅读
随着科学技术的日新月异以及社会经济的快速发展,各行各业的数据和信息呈现爆炸式增长,随之兴起的互联网智能技术标志着大数据时代的来临。如何抓住时代契机,从海量数据中挖掘出有价值的信息,进而实现对未来趋势的精确预测具有重要意义。日常生活中大量的数据和信息是以时间序列形式呈现的,常规的时间序列预测是指在一定统计模型的基础上,依据时间序列的历史值和现在值对事物未来发展趋势做出定量估计。近年来,国内外学者在时间序列预测领域内做出了许多有益的探索和研究。但是,由于时间序列数据的多样性及该类问题的复杂性,截至目前仍无一项研究可以全面应对各种时间序列数据的预测问题。现有时间序列预测模型大致可分为两类,分别是传统单一模型和组合预测模型。针对组合预测模型,按照逻辑属性又可以分为确定性组合预测模型和非确定性组合预测模型。然而,当前对于各类组合预测模型的研究都有其自身的缺陷与不足。具体剖析,尚需进一步研究的问题有:首先是关于确定性组合预测模型,确定性组合预测模型的主要目的是为实际生产生活中的时间序列数据提供有效的确定性预测。鉴于不同领域及行业所产生的数据特征各不相同,对于模型预测效果的要求也各有差异,因此有必要因地制宜地针对不同数据建立不同的预测模型;其次是关于非确定性组合预测模型,目前关于模糊时间序列模型的改进主要集中在模糊化过程、模糊关系矩阵的建立过程和对预测结果进行去模糊化的过程,而涉及到模糊逻辑关系的整体逻辑权重信息的研究较少,但这会对模糊时间序列预测模型的最终效果产生较大影响;再次是关于模型效果合理性检验的研究,针对不同类型的预测模型,线性或非线性、单一或组合、确定性或非确定性预测模型,需要对模型效果的合理性进行研究。研究发现时间序列数据可预测性水平与其多重分形的来源结构有趋势关系,因而基于分形理论,可以从数据的多重分形参数特征推断数据的可预测性水平,进而对预测模型的效果合理性进行检验。针对相关背景下的研究现状及存在的问题,本文进行多重视角下时间序列组合预测模型的建立和应用研究,围绕着组合预测理论,借助于信息融合理论、智能组合方法、模糊时间序列理论和分形理论等工具和方法,针对具有不同特征的数据类型,构建相应的确定性或非确定性组合预测模型,将其成功应用到不同的实际问题背景当中,并通过分形理论从数据的分形参数特征来检验组合预测模型效果的合理性。本文的研究内容分为六部分:第一章介绍本文的研究背景与选题依据、研究内容与意义以及研究的创新与不足之处;第二章是本文对国内外学者所做研究的梳理,通过具体剖析和述评,明确本文选题依据的针对性及合理性;第三章是对基于信息融合的确定性组合预测模型的建立和应用研究,实证过程表明该确定性组合预测模型在空气污染实际问题背景下具有良好且合理的模型效果;针对不考虑外部信息的单一时间序列数据,第四章是对基于智能方法的确定性组合预测模型的建立和应用研究,在风电输出功率预测实际问题背景下进行的实证研究表明,该组合预测模型也具有良好且合理的模型效果;第五章是对基于模糊理论的非确定性组合预测模型的建立和应用研究,该组合模型在模糊数据背景下同样具有良好且合理的模型表现;第六章是对上述研究所做的总结以及对未来研究方向所做的展望。综合本文研究结果得出的观点和结论主要包括以下三个方面:首先,基于信息融合的确定性组合预测模型具有良好且合理的模型效果。该组合预测模型的基本思想是对目标周边的信息做到最大化利用和融合,并通过分级策略对训练集进行瘦身,进而实现组合预测模型的有效训练和预测。该组合预测模型在空气污染问题背景下的实证过程中表现出良好的模型效果,并通过分析污染物数据的分形参数特征检验了所构建的组合预测模型效果的合理性。本研究可以为管理层提供有效的预测预警工具,同时为相关政策决策的实施提供理论参考和数理支持,对于我国空气污染防治工作及对策研究具有较强的意义。其次,针对不考虑外部信息的单一时间序列数据,构建了基于智能方法的确定性组合预测模型,且该组合预测模型具有良好且合理的模型效果。在风电输出功率预测问题背景下的实证过程中,所构建的基于智能方法的确定性组合预测模型表现出良好的模型预测效果,进而利用分形理论分析数据的分形参数特征,并依据本文研究发现的其和可预测性水平的关系,发现实际模型效果与由分形参数推断出的可预测性相匹配,验证了所提出的组合预测模型的预测效果是合理的。本研究不仅有利于电网的有效管理,有助于缓解不断增长的风能领域中的不稳定因素,且可以对电力市场竞价策略进行优化,对于风电行业安全高效发展有一定的现实意义。最后,基于模糊理论的非确定性组合预测模型在模糊数据背景下有良好且合理的模型表现。该组合预测模型有效组合了和声搜索算法、RIM加权方法、有序加权聚合算子并考虑了模糊逻辑关系组中的整体逻辑权重信息。基于具有不同特征的数据所开展的实证分析过程表明,所提出的非确定组合预测模型具有较高的模型稳定性和良好的预测效果。进而利用分形理论分析数据的分形参数特征,依据其和可预测性水平的关系,分析实际模型效果与由分形参数推断出的可预测性的差异,验证了所提出的基于模糊理论的非确定性组合预测模型的预测效果是合理的。基于不同实证过程的模型评估及分析,说明所构建的基于模糊理论的非确定性组合预测模型可以应用在多个领域,不仅可以应用于金融领域数据,也包括工业领域数据。本文的主要创新点有:①基于掌握的中国城市空气污染数据和中国西部风电场输出功率数据,针对不同实际问题背景中数据的特征差异,分别提出并建立一个基于信息融合的确定性组合预测模型和一个基于智能方法的确定性组合预测模型,并通过实际问题背景中的实证分析证明其具有良好的模型表现;②提出并建立一个基于模糊理论的非确定性组合预测模型,通过两个不同实证过程验证组合预测模型的良好效果,并借助分形理论从数据的分形参数特征检验了所构建的非确定性组合预测模型效果的合理性,弥补了现有研究中关于模糊逻辑关系组中的整体逻辑权重信息的空白;③不同于以往直接对实际问题背景开展的模型建立及应用研究,本文在研究时间序列组合预测模型构建及实证过程的同时,还在不同实际问题背景下通过分形理论从数据的分形参数特征来检验模型预测效果的合理性,为现实问题的模型评价和理论研究提供必要的参考依据。本文主要不足之处有:①针对不同数据类型和特征,从多重视角所构建的组合预测模型研究中用到了许多单一方法和辅助工具,实际上可能存在更优的替代方法和工具。但是在篇幅及研究时效性限制下,并未对此进行更深入更细致的研究;②研究和实证中所用到的实证数据均来源于特定的实际问题背景,如果能够在研究中考虑更多其他问题背景中的数据,可能会使得研究过程更加丰富且研究结论更加充分。