基于选择策略的时间序列预测研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:ws2005102
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为一种重要的分析复杂系统的方法,时间序列预测在诸如:对太阳黑子数、电力需求和商品物价指数CPI的预测等场合都已取得了广泛应用。其面临的问题之一即在对原时间序列进行重构后的相空间中如何建模原系统,也正是机器学习所关注的。最近Huang等人针对前馈神经网络提出了一种简单、快速,且能保持较好学习性能的算法,称之为极限学习器(ELM)。以提升ELM的效率和解决其性能的不稳定为目的,本文分别提出了基于选择部分样本学习和选择部分学习器集成的改进措施,并应用于具体的时间序列预测。1.针对ELM面向全局学习导致其计算量相对较大的弱点,且鉴于时间序列具有任意点与其近邻点演变相似的特点,基于近邻点比非近邻点对于学习更重要的假设,本文提出了仅学习部分近邻样本的基于极限学习器的局部预测器(ELMLP)。在时间序列数据集上的实验验证了ELMLP提升效率的有效性,仅以牺牲少量的性能为代价,甚至在较大噪声背景下反而获得了性能的提升。这是因为ELMLP只需学习部分重要样本,从而避免了过多不重要样本所含噪声的干扰。2.针对ELM对其中参数的随机设置导致其性能的不稳定,本文提出了极限回归器的稀疏集成算法(SERELM)。实验结果验证了SERELM不仅缓解了ELM性能的不稳定,而且改善了其性能并优于另外两个最近的集成方法。另外,集成学习的优劣通常与多样性密切相关,而如何定义和度量多样性仍是一个问题,SERELM则利用l1-正则化绕开了这一问题。在对实验结果的进一步分析后,本文发现:很大程度上,回归中常用个体间的负相关性对多样性度量无效。通过对当前尚处争议的多样性定义和度量问题研究工作的总结,本文从直觉上初步提出对多样性的分析应该建立在对个体学习器所处的假设空间的差异分析基础上。
其他文献
新浪微博目前是国内最大的微博服务平台,微博流中包含着数量众多的,各个领域的新闻事件。目前新浪上有各种各样的带标签的话题事件,已有很多的研究针对于微博上的话题检测,但
签名鉴别是一种,新兴的基于生物特征的身份识别技术,由于其方便、可靠、从笔迹中提取信息不侵犯隐私而被人们普遍接受,在商务、金融、司法、保险等众多领域中有着广泛的应用,
模式分类问题广泛存在于故障诊断、语音识别、机器视觉、文本检索、图像处理和生物信息学等应用领域。在获取分类任务的相关数据信息以后,模式分类的主要目标是利用模式分类算
乳腺癌是目前世界上发病率和死亡率较高的疾病,严重威胁人类的健康。早期诊断,早期治疗是提高乳腺癌患者生存率的主要手段。目前,乳腺癌诊断的主要方法是通过X光图像、CT、核
随着软件系统应用范围的日趋广泛,我们的日常生活越来越依赖应用软件所提供的服务,目前软件已经应用于航空航天、核电技术、军事、电子机械、金融等许多重要的特殊工程领域,
在信息爆炸的时代,互联网已经成为了信息传播非常重要的载体之一。随着时间的积累,互联网成为了一个庞大而又复杂的信息仓库,简单的浏览、检索已经不能满足人们的需求。人们
随着计算机软硬件水平的不断提高,互联网的迅速普及,多媒体的应用越来越广泛,同时,多媒体音视频的质量也有了大幅度的提高,用户对多媒体处理软件的要求越来越高。本文开发了
随着网络信息量的急剧增长,人们期待通过一种更加简洁的方式获取信息。传统的搜索引擎只能返回一系列的网页,人们期待通过一种更加简洁的方式获取信息,问答系统应运而生。问
学位
随着网络技术和信息技术的不断进步,数据挖掘引起了人们的广泛关注,传统的信息处理技术越来越不能很好地满足实际应用的需要。因此,人们迫切需要具有更高效率和更强能力的信