论文部分内容阅读
股票是金融市场的主要组成部分,其市场瞬息万变,传统的技术分析手段难以准确的预测股票市场的变化。大量的研究者运用机器学习,进行股票时间序列的研究与分析。如何提取相关性较高的股票数据特征和构建高效的机器学习模型成为当前研究的重点内容。本论文主要研究工作如下:(1)基于GARCH模型,提出了两个数据特征随机扰动项和条件方差,与股票波动具有高度的相关性。首先,获取到的股票收益率数据进行平稳性和正态性验证,构建了 GARCH模型,提取模型中的特征验证相关性。将提取的股票特征与股票基本特征、股票常用的数据技术指标进行实验,发现新特征的明显提升数据波动预测的准确性。将新数据特征、技术指标、股票成交量相结合,生成了相关性较高的数据特征。与相关论文进行比较,其中随机扰动项ut是本文基于CARCH模型提出的新特征,本文中的数据特征明显缩小误差。(2)提出基于CNN-D-LSTM模型的股票预测模型。论文针对股票预测模型普遍种类较为单一的现象,提出了将LSTM和CNN两种神经网络相结合的模型。基于LSTM、CNN相结合的相关研究中,本文提出了 CNN-D-LSTM模型,首先将数据特征分布输入LSTM、CNN网络中,利用LSTM提取时序性特征,CNN提取静态特征;再将CNN模型中的输出特征输入LSTM中,提取静态特征中的时序性特征;然后将两种LSTM层中分输出特征输入全连接,最终输出预测结果。进行了对比实验,对比预测误差、趋势预测的正确率、股票收益,提高了股票波动预测的准确性。(3)基于上述的研究基础上,设计并开发了股票波动预测系统。阐述了该股票预测的数据流程、功能设计,有利于股民获取更加科学全面的股票数据。