动态优化机器学习算法的量化多因子选股策略

来源 :华东政法大学 | 被引量 : 0次 | 上传用户:awzh963
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在金融科技不断深化的背景下,量化投资的认可度也在不断提高,近年来,量化型基金和指数型基金在权益型公募基金中的占比延续增长态势。以2019年全年来看,量化型基金规模从0.12万亿上涨到0.17万亿,占比从5.2%上涨到5.4%;指数型基金规模从0.49万亿上涨到0.77万亿,占比从22%上涨到23.8%。机器学习算法作为一种重要的AI技术被越来越广泛地应用在了量化投资中,各大量化基金公司纷纷招揽机器学习领域的人才。本文将机器学习算法与传统多因子模型相结合,以中证500指数作为股票样本池,将2015年至2019年这五年作为回测区间,候选了包括估值、成长、质量、风险、情绪、动量和技术在内的七个维度共29个因子,在经过因子有效性检验后,筛选了16个有效因子,而后结合支持向量机、随机森林、K近邻和XGBoost共4种机器学习算法建立模型。在模型建立过程中,核心内容主要为模型算法的选择以及算法的参数优化。本文采取控制变量的实验思想,在其他要素不变的情况下,仅改变模型算法,通过对比四种算法模型的预测效果,从而得出最优的算法。而在单一的算法模型中,还会涉及参数寻优的过程,这主要依靠10折交叉检验和网格搜索的方式实现,先结合参数的实际意义,给定备选值,而后选择预测效果最好的参数。本文采取动态优化的方式,在每一个滚动训练窗口,选择最优的算法与相应最优的参数。而传统的静态模型,则是利用固定的历史数据选择算法与参数,将算法和参数的选择过程前置于回测过程,这样得出的“最优算法与参数”实际上并不是在每个时间段最优的,而只是针对固定的历史数据最优。而本文这样的动态调整模型相比普通静态模型,获得了更高的收益率,且在回测过程中,在每一个时点的最优算法与参数确实是会发生动态变化的。由此,本文初步确定了量化模型,而后,在对模型稳健性检验的过程中,本文还调节了训练窗口长度、持仓数和标签设置方式,训练窗口长度不同,会造成时效性和数据充实性的不同从而影响模型效果;由于模型打分最高的股票并不一定会在下期带来最高的收益,量化选股模型的机制是选取得分相对高的股票,所以本文也调节了实际的持仓数量,对比持仓5只、10只、15只、20只股票的实际效果;另外,在机器学习过程中,标签对于学习的效果也是会产生影响的,所以本文也调节了标签的设置方式。上述调节均基于控制变量的思想。最后,本文还会对因子重要度进行了再筛选,因为简单地根据IC检验来判断因子的实际效果是比较片面的。最终本文最优模型的机制为:持仓数为10,训练窗口长度为12个月,以样本股票池每月涨幅前10%的股票作为正分类,后10%的股票作为负分类,因子采用所有初始候选因子。该模型自2015年至2019年共累计获得回报率235.17%,年化收益率47.03%,跑赢了同期全市场的公募基金。
其他文献
桁架斜撑、桥梁缆索、空间结构的撑杆或弦杆、体外预应力束以及拱桥的吊杆与系杆均属于轴向荷载作用下的一维结构构件,准确快速地测试其轴向力是非常重要的,测试方法中应用最
随着我国能源结构由化石能源向非化石能源的不断转换,作为一种重要的可再生清洁能源,抽水蓄能电站承担着电网调峰调频等重要任务。此外,近年来风光等间歇性能源大量接入电网,
铅酸蓄电池因放电电压高、生产成本低、易于浮充使用、性能稳定等优点在交通运输、国防、军工等领域发挥着重要的作用。但由于板栅本身强度不足及板栅长大等问题,板栅很容易
跨期决策中,个体在延迟奖励(Larger–Later,LL)和即时奖励(Smaller–Sooner,SS)之间进行选择,时间折扣的存在使得个体更倾向于赋予即时奖励较大的权重(李燕,徐富明,2015)。青少年期的学生正处于自我同一性形成和发展的关键期。前人研究发现注意偏向训练和奖励联结训练可以改变个体的注意模式,影响个体的注意选择。本研究采用注意偏向训练和奖励联结训练任务来训练初中生对现在、未来的
中国共产党的党内政治文化是党的政治建设的重要组成部分,也是党的建设在新时代发展的成果,党内政治文化建设与中国特色社会主义文化建设相承接,与新时代国家对党的建设提出的新要求相契合。自党的十八届六中全会首次提出党内政治文化的命题以来,有关于党内政治文化的理论解读和路径探析取得了系列进展。党的十九大报告中,习近平总书记再次强调了党内政治文化的重要地位和作用,在新时代,发展积极健康的党内政治文化是营造良好
监督是纪检监察机关的首要职责、第一职责、基本职责。高质量发展是新时代纪检监察工作的主题主线,是纪检监察机关的重大政治任务,而高质效的监督是纪检监察工作高质量发展的
在机械工业中,机械臂逆运动学规划是一个重要的研究方向。对于机械臂的逆运动学规划,传统的伪逆方案无法保证机械臂不超出物理约束;传统的二次规划方案需要知道精确的机械臂物理参数。在实际应用中,常会出现由于物理磨损造成的机械臂的物理参数不同于真实值,机械臂关节超出物理约束造成机械臂损坏等现象,上述情况下传统的方案不适用。本文讨论了机械臂逆运动学规划问题,设计了一种基于自适应神经网络的逆运动学方案。对于物理
在现代社会中,宪法与法律赋予公民以权利,并为公民合法行使权利保驾护航,为被侵权者提供公力救济的渠道。因而,当公民的权利遭受他人侵害时,理应通过正当渠道寻求救济,这是现代法治国的基本要求。但事实并非总是如此。在刑事司法实践中,公民采取扣押拘禁、盗窃、抢夺、抢劫、敲诈勒索等非法手段实现自身债权的案例仍屡见不鲜,这种行为在刑法理论中被称为债权行使。我国刑法理论对于债权行使的刑法定性已达成基本共识,即债权
在信息技术的加持下,数据采集的深度与广度持续增加,以往的数据量级单位已经无法准确反映大数据时代的特征。大数据并不仅是海量数据堆积的结果,其背后蕴藏着价值等待发掘。
有机过氧化物因具有强氧化性和自反应性的特点,极易造成火灾、爆炸事故,因此保障有机过氧化物的安全应用,已经变成高分子材料和橡胶工业中的重要一部分。1,1-双(叔丁基过氧基)-