论文部分内容阅读
在新一轮产业变革和科技革命的背景下,随着人工智能、云计算、大数据、区块链以及物联网等技术的蓬勃发展,金融科技正在将崭新的科学技术成果应用于金融领域中,对传统金融行业的组织体系、业务流程及产品设计等方面产生着较为深远的影响。2019年9月央行发布的《金融科技(Fin Tech)发展规划(2019-2021年)》指出加快金融科技战略部署与安全应用,已成为深化金融供给侧结构性改革、增强金融服务实体经济能力以及打好防范化解金融风险攻坚战的必要选择。金融科技的不断发展也在助推着量化投资的升级和发展,金融交易自动化、风险管理科学化、投资理财智能化等手段使量化投资能够在金融市场发挥巨大的优势。鉴于我国量化投资仍处于发展早期阶段的现状,运用人工智能、机器学习等方法刻画金融市场非线性特征,帮助投资人做出投资决策发展前景广阔、潜力巨大。使用合理的深度学习网络对股价序列进行预测、预测任务中输入特征及特征处理方法的选择和投资组合策略的构建是目前学术界对深度学习在量化投资领域应用研究的重点。Sezer et al.(2020)总结了自2005年至2019年使用深度学习进行金融时间序列预测的文献,其中31%左右的文献将研究问题放在股价预测上,使用到的模型包括多层感知机、循环神经网络、长短期记忆网络、卷积神经网络、深度信念网络及自编码器等。Zhai et al.(2007)将新闻信息及技术指标作为输入特征提升了股价预测的准确率。Tsai和Hsiao(2010)发现已有研究多使用逐步回归、主成分分析及正则化等方法对输入特征中有效信息进行提取。Arévalo et al.(2016)基于全连接前馈网络的股价预测结果构建了高频“低买高卖”交易策略。从已有研究成果来看,大部分文献将注意力集中在使用先进的网络结构及合适的特征选择方法提高股价的预测精度上,忽视了投资组合策略的构建过程,也并未对组合风险进行有效控制。在此背景下,本文将基于长短期记忆网络和注意力机制构建股票价格预测模型,并将预测结果引入改进后的投资组合优化模型构建投资组合策略。其中注意力机制不仅对输入特征进行信息提取,同时也关注了不同时间步上的输出信息。本文也对模型训练过程中输入特征注意力权重变化、相同模型在不同个股上及不同模型在相同个股上的预测效果进行比较分析。最后对比分析了各投资组合策略在样本期外的回测表现及有效前沿变化,并就不同市场风格下各策略特征进行探讨。构建基于深度学习的投资组合策略要经过数据收集和预处理、训练学习模型并产生预测结果、基于预测结果结合优化模型进行资产配置及评估预测模型及策略回测结果等几个步骤,既要选择有效的输入特征,又要设置合适的模型超参数,还要考虑优化模型中风险测度指标的合理性。因此本文采用规范分析和实证分析相结合的研究方法进行研究。规范分析方面,本文将对目前基于深度学习的股价预测方法、股价预测任务中的特征选择方法、深度学习在量化策略构建中的应用及均值方差模型在实践中面临的挑战等方面的研究文献进行总结归纳,挖掘把握当前研究的理论方向。实证分析方面,本文使用Tensor Flow开源工具构建基于长短期记忆网络和注意力机制的股票价格预测模型对上证50指数的成份股收盘价进行预测,通过Python语言完成基本数据处理及相关数值运算,使用Scipy包中的optimize工具对优化模型进行求解。本文总共分为五章,第一章为绪论,对本文的研究背景、研究意义、研究方法、研究内容及创新之处进行阐述。第二章为文献综述,详细介绍了基于深度学习的股价预测方法、股价预测任务中特征选择方法、深度学习在量化策略构建中的应用及均值方差模型在实践中面临的挑战等方面的研究现状,最后对目前研究进行了简要评述。第三章为研究设计,首先对本文构建股价预测模型使用的长短期记忆网络进行阐述,并给出注意力机制的原理及嵌入方式。其次,在均值方差模型及尾部风险测度指标的基础上,给出了改进后的投资组合优化模型。最后,详细阐述了如何基于模型预测结果结合投资组合优化模型构建投资组合策略,并介绍了回测分析中常用的风险评价指标。第四章为实证分析。本文使用上证50指数及其部分成份股在2008-2018年的每日收盘价数据进行实证分析。首先基于上一章构建的股价预测模型,通过设置合理的模型超参数对成份股收盘价进行预测,并对模型训练过程中输入特征注意力权重变化、相同模型在不同个股上及不同模型在相同个股上的预测效果进行比较分析。其次,使用根据模型预测结果计算的预期收益率代替基于方差、Va R、CVa R及CDa R等风险测度下投资组合优化模型中常用的样本均值估计构建投资组合策略,并对比分析了各策略在样本期外的回测表现。最后分析了考虑交易手续费用下各组合的回测表现并对模型在股指上的预测效果进行探究。第五章为结论,在前文实证分析结果的基础上总结本文的结论,就研究结论对金融市场参与者提出相关政策建议,并针对细节不足分析进一步研究方向。本文得出的研究结论主要有:(1)上证50成份股未来价格除了受自身历史价格影响外,还受到其他正/负相关股票及指数历史价格的影响,股票自身历史价格与其未来价格相关性最为密切。(2)基于注意力机制的MI-LSTM模型能够捕捉输入特征的不同重要性,从多个输入特征中自适应地提取有益于预测任务的有用信息,提高原LSTM模型的预测精度。(3)MI-LSTM模型在股价预测任务上的预测效果与输入特征包含的信息有着密切关系,选取不合适的输入特征可能会导致模型预测效果变差。(4)LSTM及MI-LSTM模型在不同股票价格预测任务上的预测误差不同,对价格波动较为剧烈的股价序列预测效果更差,这反映了股票价格的复杂性与不确定性。(5)使用神经网络预测的股价计算预期收益率方式代替传统优化模型中的样本均值估计能够有效提高组合的收益及抗风险能力,并且能够跑赢指数及等权重组合,使用更精确的输入估计能够提高组合收益能力,降低波动和回撤风险。(6)从市场风格来看,当市场处于慢牛状态时,基于方差的投资组合更能够获得超额收益;当市场处于单边下跌状态时,基于CDa R的投资组合更能够抵抗资产价值损失,有效规避投资风险。本文研究的创新之处体现在以下几个方面:(1)提出了基于注意力机制的股价预测模型,其中注意力机制体现在输入特征及时间步两个层面上,考虑了正负相关股票价格以及指数价格对目标股票价格的影响,新模型能够捕捉输入特征的不同重要性,从输入特征及多个时间步的隐含状态中提取有效信息。(2)已有部分文献探索使用贝叶斯收缩、最小方差组合及鲁棒优化算法解决投资组合优化模型在实践中的应用问题。这些研究使用的大部分方法都基于证券收益的正态性假设,忽略了大量交易数据中蕴含的信息。本文使用基于深度学习股价预测模型预测结果计算的预期收益率代替模型中的样本一阶矩估计,拓展了投资组合优化理论在实践中应用的思路。(3)目前深度学习在量化策略构建中的应用研究较少,这些研究往往只是构建“低买高卖”交易策略,且国内研究主要应用于期货期权市场。本文将先进的深度学习算法与传统投资组合优化模型相结合构建有效的我国股票市场投资组合策略,丰富了深度学习在量化策略构建中的应用研究,为后续研究者提供有效借鉴。本文还存在以下不足之处:(1)本文模型中的输入特征使用的是只有价格数据,特征的选取存在一定的主观性。需要探究一些基本面数据例如盈利性数据、成长型数据、杠杆数据或国内各大财经论坛舆情数据的加入能否对股价的预测产生正面效果。(2)本文资产配置是日度调仓进行的,而现实情况中基金经理调仓的频率一般是月度或者季度进行的,如果日度调仓确实难以承担高额的手续费用。有必要探索如何使用高性能神经网络实现低频数据的高质量预测,尽可能地使研究符合现实生活情境。