论文部分内容阅读
针对金融资产未来收益的随机性,结合强化学习的原理,以Q-learning算法构造强化学习框架,来解决投资组合优化问题.采用一只股票连续数日开盘价和收盘价的涨跌幅信息作为状态,其中开盘信息在一定程度上纳入了市场消息面因素,收盘信息则直接反映股价波动情况,而连续数日的数据为模型加入了预测能力以用于指导投资.实证分析表明,投资者采用本研究方法进行投资可以得到较高且稳定的收益.