基于数据特征驱动分解的季节性时间序列预测模型研究及应用

来源 :东北财经大学 | 被引量 : 0次 | 上传用户:play5
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列预测是当今社会应用最为广泛的数据驱动建模预测方法之一。早期的经典时间序列预测模型以随机过程和数理统计为理论基础,随着计算机科学、数学、管理科学、统计学、生物工程等学科的发展与交叉应用,机器学习等可计算智能方法得到迅速发展,凭借在参数估计、模型结构等方面的灵活性以及预测性能的优越性,这类方法已经成为当下时间序列预测领域的研究热点。然而,无论是经典时间序列预测模型,还是较为先进的机器学习模型,任何一种方法都有其优势和劣势,都不足以应对所有类型的时间序列数据预测问题,尤其是在大数据时代背景下,互联网、信息技术与人类生活的交融使得数据资源得以快速积累和膨胀,面对如此庞大的信息量,几乎所有模型的结构、参数估计、运行计算、稳定性、适应性等都将受到挑战。基于以上背景,本文在对传统的统计预测模型、机器学习模型、单一模型、组合模型、混合预测模型的梳理和总结基础之上,重点研究基于数据特征驱动时序分解的复杂季节性时间序预测模型构建问题。具体而言,所建立的预测模型具有系统性的理论框架,主要涵盖以下四个方面:第一,预测模型的建立以数据特征驱动为导向。现有的预测模型多注重对方法本身的改进,而较少地以数据特征为出发点进行切入,季节性时间序列数据作为一种独特的数据类型,其波动受到多种潜在特征成分共同驱动,如果能够对序列中的不同成分进行有效的数据特征挖掘与分析,则可以使得所建立的模型更具有针对性、合理性和鲁棒性。第二,针对季节性时间序列的结构性特征,模型构建采用基于分解思想的问题解决思路,目的是降低由于原始序列的高度复杂性所带来的不确定性风险,进而更易于挖掘和分析时间序列的内部规律。第三,以前沿性的可计算智能方法为预测模型的核心要素,就此而言,无论是从预测精度还是从适用性角度的比较,机器学习模型在复杂性时间序列预测方面都要比经典的时间序列模型更为优异。第四,特征选择作为一个重要方向被绝大部分混合预测模型所忽视,现有的混合预测模型多注重方法本身,而鲜有研究开展深入的特征分析过程。综合以上四个方面,本文充分考虑到季节性时间序列的独特波动规律,开展复杂季节性时间序列预测模型研究。本文的研究内容共有六个部分:第一章介绍了研究现状、选题依据、主要研究内容、研究意义、研究创新和不足。第二章对相关的数据特征驱动时序分解及特征辨识方法进行了系统性论述。第三章主要考虑到是季节性时序数据受到不规则波动信息干扰情形,基于数据特征驱动分解的降噪设计、机器学习以及智能优化算法建立了混合预测模型。第四章延续了数据特征驱动分解的视角但区别于降噪的思路,基于分解集成的问题解决思路,构建了集成策略理论框架,提出了系列分解集成模型。第五章拓展和深化了第三章和第四章的研究,但区别于降噪和分解集成的建模思路,基于数据特征驱动分解从特征选择的视角来建立预测模型,并将模型的构建嵌入到了特征选择过程中。第六章对本文的研究进行了总结,并对未来的研究方向进行了展望。基于典型数据集的验证,主要研究工作和创新体现在以下三个方面:首先,现有的单项模型主要存在两方面的缺陷:一是时间序列中的潜在不规则波动成分使得预测模型无法更为有效地捕捉数据的产生机制;二是现有的绝大部分单项模型都存在设定不精确、结构不稳定等问题。针对以上不足,本文利用奇异谱分析、支持向量回归和布谷鸟搜索算法设计了一个季节性时间序列混合预测模型,该模型具有如下两方面的改进:①针对季节性时序数据含有的不规则变动成分,设计了季节性时序数据的降噪流程,该流程能够对数据中存在的潜在特征成分实现可分性分解,进而将不规则波动成分成功分离;②通过引入人工智能算法,避免了传统机器学习方法陷入局部最优的缺陷。其次,基于分解的问题解决思路,第一,对于存在多季节性模态的季节性时间序列,如果能够实现具有特定意义的成分的可分性分解,则可以降低由于多个成分混叠带来的不确定性,根据这一思想,本文提出了一个多季节模态时间序列数据的分解方法,该方法能够充分挖掘数据中的结构性成分,并且分解得到子成分具有较强的可解释性和可分性特点;第二,基于分解建模的思路,为了有针对性地建立子问题的解决方案并整合它们,本文首先根据子成分的波动特征有针对性地建立单项预测模型,然后为了能够有效地整合或集成单项预测结果,构建了线性回归集成策略、非线性回归集成策略、基于智能搜索算法的集成策略的最优化集成权重求解方法,提出了系列分解集成预测模型。最后,反观绝大部分混合模型的建立过程,可以发现主要存在以下两个方面的问题:第一,当仅考虑时间序列数据本身时,预测模型的输入特征选择就只能依赖于原始序列的延迟特征,从而很难深入挖掘序列中的潜在信息;第二,由于整合了不同的方法,绝大部分混合模型面临着计算复杂度高等缺点,而特征选择是一个的复杂搜索过程,进而很难融入混合模型。针对研究中的不足,本文基于数据特征驱动分解,将混合预测模型的建立嵌入到了特征选择过程中:①基于数据特征驱动分解,建立了单变量时间序列情形下的特征空间,该特征空间充分地容纳了季节性时序中的每一潜在成分或模态的有效滞后信息,进而更为有效地挖掘了数据的产生机制和所提供的信息;②为了从特征空间中筛选出最优的特征子集,提出一个新颖的混合特征选择算法,该算法融合了传统Filter和Wrapper法的思想,一方面通过智能搜索算法对Filter法进行了优化改进实现动态全局性特征子集搜索,另一方面通过嵌入机器学习算法实行特征子集评估,从而使得选择过程具有简便、快捷、最优化的优点;③采用奇异谱分析、集成经验模态分解和经验小波变换三种多尺度频域分解方法,选用支持向量回归作为评估特征子集的预测模型,利用布谷鸟搜索算法的全局求解优势,建立了系列季节性时间序列混合预测模型。本文通过典型案例数据集研究验证了所提出的系列模型的理论价值和应用价值,既丰富和补充了现有的时间序列预测方法研究体系,又能够为相关问题的解决提供重要的参考依据。具体而言,首先从数据特征驱动建模切入,基于多尺度分解方法建立了系统性的预测模型构建框架;其次,针对季节性时间序列预测问题,提出了分解降噪的混合预测模型构建思想、基于分解集成的系列混合预测模型构建思路、基于数据特征驱动分解的最优化特征选择混合预测模型的构建思想;最后,本文提出的基于数据特征驱动分解的系列混合预测模型系统性地整合了不同的方法,既能够改善预测的精度、稳健性和泛化能力,又能挖掘季节性时序数据的潜在波动特征。主要有如下两点不足:①模型的构建主要利用了先进的多尺度频域分解技术、机器学习模型和人工智能搜索算法,在未来的研究中,可以考虑更多的分解技术和机器学习方法进行扩展研究。②只考虑一类季节性时序数据,未来的研究可以采用不同采样频率季节性时序数据,并将外生因素纳入建模框架以增强模型的可解释性和推广价值。
其他文献
多载量多自动导引车(Multi-load Automated Guided Vehicles,Multi-load AGVs)广泛应用于车间的物料搬运,其调度系统是智能车间物料搬运系统的核心,对提高智能车间的物流效率和生产稳定性具有重要的意义。为此,本文对多载量多AGV的调度问题开展了深入研究,共包含派送任务的生成与选择、派送任务的分配、回收任务的分配、AGV综合路径规划四个关键问题。主要工作如下
CFO作为企业战略决策的制定者、财务管理与财务治理的领导者、资本经营与资本运作的主导者,在应对企业战略转型、投资决策、融资方案、资本运筹以及企业重大决策事件时发挥着重大作用,CFO是企业价值管理、价值创造和风险管控的中枢,CEO的战略合作伙伴,更是运用财务契约工具协调并解决公司治理中代理问题的有效载体,在现代公司治理框架下发挥着财务监督和战略支持基本职能,以股东价值最大化为导向进行战略决策和公司管
河口是部分封闭的、存在咸淡水混合的水体。河口具有重要的生态功能,这些功能受到河口水动力、泥沙动力、以及人类活动干预的强烈影响。因此,实现河口区域的可持续发展及有效管理,需要对水动力、泥沙动力、与人类活动影响之间的相互作用有深刻的理解。然而,河口通常又是极为复杂的系统,它受到径流、海岸动力(风、浪、潮)的影响,二者都与人类活动存在不同时间、空间尺度上的相互作用。其中,对于受工程结构重要影响的系统而言
学位
近年来,随着服役条件的日益严苛,镁表面单一的防护膜已不能满足使用要求,故科技工作者们纷纷开始在镁表面制备复合膜来进一步提高其耐蚀性。在目前公开报道的文献中,与微弧氧化(Micro-arc Oxidation,MAO)相结合的复合防护技术各有特色,制备得到的复合膜能够在一定程度上提高镁表面的耐蚀性,但缺点也比较明显,其中电镀、化学镀等的处理液对环境污染较大,有机涂层方法制备的防护膜其结合力较差,磁控
学位
并购是国有企业实现提高资本积累率、剥离落后产能、优化资本结构等战略目标的重要手段,并购绩效则是对并购效率和效果的集中体现。在当前“做强,做优,做大”国有资本的政策背景下,如何增强驾驭厚重资本的能力、提升并购绩效水平,成为国企实现跨越式发展的关键。相对于国有股东而言,非国有股东的利益目标较为单一,更加关注投资的经济效益。向国企中引入非国有股东,使其积极参与治理活动,发挥相应的监督、制衡作用,可能成为
为贯彻落实我国关于进一步扩大对外开放的决策部署,按照“宜快不宜慢、宜早不宜迟”的原则,在深入研究评估的基础上,国务院金融稳定发展委员会2019年推出了金融业对外开放新举措,这标志着我国期货和现货市场的进一步开放。期货市场上提供给投资者的机会越来越多,与此同时,现货市场复杂程度也很高,而且是一个不断变化的动态系统,相关投资者稍有不慎就会面临投资损失的风险。在现货市场投资时如何规避风险、分散风险,并同
当前我国经济面临着内部结构性供求失衡和外部环境不确定性加剧的双重压力,在经济新常态下,政府采取宏观逆周期政策配合供给侧结构性改革等举措确保“调结构”、“稳经济”、“保战略”的持续推进。然而,政策传递和改革红利的释放存在时滞,新旧动能转化的复杂条件和需求不足的惯性压力使得“大水漫灌”若不谨慎引导则会加剧整个经济系统的脆弱性。同时,我国多层次资本市场逐渐形成,各类资本市场主体多样、规模不断扩大且相互间
教育是创新型人才培养的主要阵地,各国都把创新能力作为核心素养的重要内容,凸显了培养学生创造性思维的重要性。小学阶段是儿童创造性思维发展的关键时期,儿童的创造性思维培养具有其独特性,既要研究创造性思维发展的一般规律,又要研究儿童思维发展的特殊规律,研究者就如何基于小学科学教育培养儿童的创造性思维开展研究。研究者对D小学进行了长达2年的实地调查与观察,并且与D小学的科学教师进行了长期的交流与访谈。在此
资本作为经济运行的重要载体,经济学家通常关注资本作为生产要素的一面,统计学家通常关注资本作为核算对象的一面。资本在经济学和统计学中的关键地位要求学者们对它做出更严谨准确的测算,由于资本测算的复杂性,学者们很难实现“完美的”测算,而这正是值得研究的地方。资本测算源于对国民财富和生产率水平的衡量需求,是摸清一国“家底”与生产能力的重要途径。资本测算可以分为资本存量测算和资本服务测算,资本存量又区分资本