基于两阶段特征提取的BiLSTM-GRU股价预测研究

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:yuyu198995
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
股票市场不仅受众多因素的影响,且影响因素间也存在复杂的非线性动态交互关系,使得时间序列数据成为一个具有序列相关性、非平稳性、非线性等综合特征的复杂系统。因此,构建科学有效的方法实现股市的精准预测成为一项极具挑战性且具有重要学术和应用价值的工作。传统的计量经济学方法和浅层机器学习方法,存在对原始数据处理能力不足、过拟合、收敛慢等重要缺陷,股价序列的特征提取及预测建模成为了金融数据建模领域的一个关键难题。本文以沪深300指数和中证500指数作为研究标的,提出了一种基于两阶段特征提取的Bi LSTM-GRU股价预测集成框架,将特征提取与深度学习相结合,用于股市日收盘价预测。考虑到股票市场影响因素众多,引入多个外生变量作为模型的输入变量。在对数据预处理后,第一阶段特征提取采用主成分分析(PCA)降低数据输入的维度,可以避免数据之间的冗余,提高算法的运行效率。考虑到股票价格变化的复杂性,单靠主成分分析处理数据远远不够,因此第二阶段特征提取采用层次聚类对降维后的数据进行分类。层次聚类挖掘并重新排列训练数据中外生变量的主要特征,将强相关数据划分为一类,形成不同的训练子集,避免训练数据特征分散导致模型缺乏泛化能力的问题。特征提取为后续建立双向LSTM神经网络(Bi LSTM)进行预测奠定了基础。对于每个训练子集,分别建立Bi LSTM神经网络,得到对于每一类别的预测结果。最后,将Bi LSTM的预测结果输入到门控循环单元(GRU),GRU对多个Bi LSTM的预测结果进行集成,利用神经网络的拟合优势,进一步拟合数据中的非线性特征,使预测结果最优化。为了验证本文所提混合模型的有效性,将其与机器学习、单一深度学习等基准模型做对比实验,结果表明该混合模型有效结合了各个模型的优势,能充分学习股票时间序列数据的多尺度、复杂动态等特性,具有更高的预测精度和更强的泛化能力。本文为中国A股价格预测提供了一种可行的思路和方法。
其他文献
<正>自身免疫性甲状腺疾病(autoimmune thyroid disease,AITD)是临床多发的器官特异性自身免疫性疾病,发病率约为5%,在甲状腺疾病中占90%,主要分为桥本甲状腺炎(Hashimoto thyroiditis,HT)和格雷夫斯病(Graves disease,GD)。该病患病人群近年来不断增加,但发病机制尚不明了,可能是由于遗传因素、环境原因及内分泌激素共同导致免疫系统失
糖尿病(diabetes mellitus,DM)是一种慢性内分泌代谢性疾病,氧化应激的增加是糖尿病的一个重要因素,氧化应激也被认为是导致糖尿病病程变化的关键因素。硒作为一种功能性的微量元素,以硒蛋白的形式(如:谷胱甘肽过氧化物酶、硫氧还蛋白氧化还原酶)体现其生理功能,硒蛋白作为抗氧化蛋白在糖尿病的氧化应激机制中发挥重要的调节作用,参与抗氧化主要环节。本文主要介绍硒在糖尿病中抗氧化的相关作用,为硒
针对电商评论数据缺乏深层次的情感分析和语义知识关联,不利于系统挖掘潜在的消费情感和客户满意度信息问题,以京东电商评论数据为例,提出一种融合多头注意力机制和双向长短时记忆网络模型(bi-directional long short-term memory,BiLSTM)的电商评论情感分析模型。首先,通过词嵌入将文本数据转化为句向量;其次,构建融合多头注意力机制的BiLSTM模型,利用BiLSTM捕获
目的探讨优质护理举措在神经外科脑肿瘤病人围手术期的应用价值。方法选择我院神经外科于2019年5月至2020年5月收治的100例脑肿瘤病人作为研究样本,任意抽取分为2组,每组各50人。对照组给予一般护理措施,优质护理组给予有针对性的相关优质护理举措。对比各组对医护工作方面的满意程度、心理状态的变化情况、术后手术并发症的产生概率。结果优质护理组的SAS(焦虑自评表)与SDS(抑郁自评表)评分均低于对照
随着对外汉语教学的不断完善,汉语教学也从传统的语音、词汇、语法的教学转变为更注重汉语的实际应用能力的教学,留学生的汉语语用能力越来越受到重视。本文指出培养留学生汉语语用能力的重要性,将成果导向教育理念与留学生汉语语用能力相结合,探讨留学生的汉语语用能力培养问题,并对留学生汉语语用能力的培养提出建议。
报纸