基于文本分析和强化学习技术的股票交易策略及实现

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:piaobozaiwai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
截至2020年年底,我国A股市场上市公司已有4140家,总市值超86万亿元,而随着年底全民炒“基”浪潮的掀起,大量投资者被资本市场吸引,社交媒体的普及也使得一时间网络上的金融舆情数据暴涨。如何利用数据挖掘、自然语言处理、机器学习与深度学习等人工智能手段从网络媒体平台提取并分析有效信息,推导出有效因子与策略,成为近年来券商的热点研究话题。本文系统比较了国内外关于文本挖掘和深度强化学习的学术研究,并详细介绍了相关算法的理论基础。本文充分论证了以人工智能技术中的深度学习算法为预测模型,强化学习算法为决策模型,应用于投资领域的可行性。同时,针对国内文献中遗传规划优化不足、传统强化学习效率低下等问题作了必要的弥补与改进。首先,本文利用爬虫技术爬取股票相关微博,获取了股票评论文本数据,利用Snow NLP技术将所得股票评论信息量化为情感因子,并结合统计学,构建了6个基本因子。随后,通过遗传规划以互信息和超额收益作为评价标准,从这6个基本因子中挖掘出20个较高收益的舆情因子。接着,基于注意力机制的LSTM利用20个舆情因子特征来预测股票的涨跌,并买入上涨概率较大的股票、卖出上涨概率较小的股票来回测得到交易的收益率,通过比较收益率大小对不同机器学习算法选股方法进行评估,发现基于注意力机制的LSTM模型收益率最高,得到了最好的预测效果。其次,本文综合考虑了艾略特波浪理论和马尔科夫状态,针对原有算法的不足,提出优化的深度强化学习方法。对传统的波浪理论方法进行改进,先对K线数据进行包含关系处理,接着划分为顶分型和底分型,然后用高阶分型找出每个波段的高点和低点,以次高点和次低点的间隔为中枢,把股票的价格设计为中枢下、中枢内和中枢上三个区间,把三个区间用数字0,1,2表示,并且把三个区间设置为强化学习中马尔科夫链的状态,计算每一个状态的概率转移矩阵,基于注意力机制的LSTM利用20个舆情因子特征来预测股票的涨跌,当预测的股票上涨概率较大并且预测的马尔科夫状态为0时买入股票,预测的马尔科夫状态为1的时候锁仓不进行股票交易,预测的股票下跌概率较大并且预测的马尔科夫状态为2的时候清仓卖出股票。该方法借助于强化学习策略梯度方式,将有用的特征作为基础,并对神经网络中的参数进行遍历,基于深度学习的预测能力,与强化学习的决策能力完美融合。当面对大量历史数据时,基于深度强化学习的金融量化交易模型,可确保智能交易算法在股票的实时交易中进行数据挖掘。同时,使投资者准确把握交易点,完成正确的投资判断,减少整个投资过程中面临的风险。最后,本文为解决传统量化交易软件的不足,结合遗传规划挖掘的舆情特征和基于注意力机制的LSTM以及波浪理论优化的深度强化学习股票投资方法,创新性地开发设计了一个可进行深度强化学习的量化交易系统。该交易系统通过智能决策来买卖股票,具有很强的应用价值。系列实验表明,本文设计的模型在舆情分析与投资决策分析两方面均取得了很好的效果,也验证了提出模型的有效性和本文观点的正确性。以深度强化学习技术为基础,同时和惯用的金融量化交易分析的方法相结合,有利于两者的优势充分发挥,进一步促进人工智能、深度学习算法与经济学、管理学的交叉融合研究,为响应并推进国家人工智能战略的实践提供参考。
其他文献
学位
随着音乐以数字化方式创作、呈现和传播的发展趋势不断扩大,现有的基于实物载体的音乐作品版权认定、保护方式已经不能很好的适应完全数字化的音乐生态。本文希望借助计算机应用技术,信息安全技术和区块链技术设计实现一种基于区块链的可信音乐版权存证模式,论文通过优化现有音乐(音频)指纹提取算法,实现对音乐版权要素(歌词、编曲、作者信息,以及生成的国际标准音乐作品编码)的提取,算法提取过程不仅包括数字音乐的成品,
目的:本研究1在少汗性外胚层发育不良(hypohidrotic ectodermal dysplasia,HED)患者中检测ectodysplasin A(EDA)基因突变,汇总并分析携带EDA基因突变的HED患者的临床表型及先天缺牙的易感牙位特征。方法:1.对临床收集到的11个HED家系进行遗传病史采集、全身系统性检查和口内检查,通过采集先证者及其家族成员的外周静脉血或唾液样本,提取基因组DNA
学位
本文主要关心复杂流体动力学中的一些分析问题,作者对其中的两个基本的粘弹性流体力学模型的经典解的整体存在唯一性和不可压缩极限进行了研究。而且,作者建立了两个粘弹性流体力学旋转-应变模型,发现了几个重要的潜在物理条件,证明了小应变解的整体存在性。首先,作者考察了一个不可压缩粘弹性动力学方程组,它由一个有衰减的动量守恒方程和一个没有衰减的传输方程耦合而成。该模型常用来从宏观角度上模拟应力张量有某种对称性
《普通高中思想政治课程标准(2017年版2020年修订)》凝练了思想政治学科核心素养,同时对学科核心素养的培育途径做出了具体阐述。指出学科核心素养是个体在复杂程度不同的真实情境中,运用学科思维与方法、学科知识与技能,分析问题、解决问题的过程中培育、发展起来的。同时指出,教师要转变教学方式,要通过议题的引入、引导和讨论,使思想政治课堂教学在师生互动、开放民主的氛围中进行。由此可见,高中思想政治课堂提
学位
伴随着智能科技浪潮的兴起,自动驾驶技术开始飞速发展。如今,传统车企、科研院校、科技企业以及新兴初创公司成为自动驾驶行业的主要参与者。城市道路作为车辆主要应对的道路场景,具有交通条件复杂、车流量大等特点,智能驾驶技术的应用可以有效提升城市道路场景下的道路交通安全、通行效率并降低交通运营成本。现有城市场景结构化道路下的运动规划方法主要考虑换道策略以及局部的绕障情况,未综合考虑路段限速、舒适性约束以及运
因肿瘤、炎性病变及外伤等原因引起的颌面部软硬组织缺损长期未经治疗或接受不完善治疗会引起局部组织功能障碍及面部畸形,严重时甚至会危害患者的心理健康及生活质量。本研究利用三维细胞打印的方式,以期获得一种负载细胞的一体化的软硬组织结构体,有助于实现复杂的个性化软硬组织修复。三维细胞打印利用水凝胶包裹细胞后逐层堆积打印的方式,能够精准控制不同生物材料和细胞在结构体内的空间分布。此外,数字化扫描及设计的引入
环状RNA是一类在反向剪切过程中形成的两端共价相连的RNA分子,广泛存在于生物体内,具备多种生物学功能,已经成为生物医学的研究热点。独特的环状结构使得环状RNA缺少5’帽子结构和3’多聚腺苷酸尾巴结构,从而无法通过经典的帽子依赖途径翻译蛋白,因此曾被归类为非编码RNA。然而,最新研究发现环状RNA可以通过非经典的非帽子依赖途径发挥翻译功能。互补内含子序列所介导的环状RNA过表达系统是目前最常使用的