基于主成分分析的股票多因子量化投资策略研究

来源 :时代金融 | 被引量 : 0次 | 上传用户:linxiong12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:本文利用中国A股市场中所有股票近年来的相关财务数据与行情数据,对500多个股票因子进行了显著性分析与主成分分析,构建了两个新的选股主因子:技术因子与价值因子,并以此为基础建立了多因子量化选股策略。最后利用近五年数据对该策略进行了回测与实证分析,结果表明该策略在不同市场行情下都能够在低风险的同时稳定地获取超过基准收益率的高额回报。
  关键词:量化投资 股票 主成分分析 多因子模型
  一、引言
  Famma与French(1993)[1]基于市值、账面市值比和市盈率建立了著名的三因子模型,奠定了多因子选股模型的理论基础。目前,人们已经提出了上千种能够反应股票各种信息的因子,因而如何从中选取符合市场行情的有效因子成为了当下热点研究问题之一。而主成分分析方法[2] [3][4]可以很好地解決这一问题,其不仅可以提炼出对股票收益率有显著影响的因子,并且可以解决各因子数据间的相关性问题。
  二、数据预处理
  本文以中国A股市场中的全部3000余只股票和点宽网因子库中的所有500多个因子作为研究对象,数据来源于点宽网的商用数据库,研究的样本区间为2016年1月1日至2018年9月30日。所使用的数据分析软件和编程软件为SPSS、AutoTrader与MATLAB。
  首先根据准则对数据进行去极值处理,然后采用零均值化,将数据按照一定比例缩放到0与1之间,并满足均值为0、标准差为1,最终得到标准化的数据。记为因子库中的全部因子,为A股市场中的全部股票,其中N、M分别表示因子的总个数和股票的总只数。用序列表示股票对应于因子的日频数据,其中为样本区间内总交易天数。
  由于某些因子值需要根据各公司月度财报数据进行更新,因而本文的模型均采用按月换仓的交易策略,这就需要将前文的日频数据序列转化为月度数据序列。设整个样本区间共包含了T个月,用序列表示股票Si对应于因子Xj的月度数据,其中取为中第t个月的最后一个交易日所对应的数值。
  三、IC显著性分析
  IC(信息系数)是由因子在某只股票上的因子暴露与对应股票下一期收益序列间的相关系数来确定的,即因子Xj关于股票Si的IC值为
  其中为因子月度数据序列的前T-1个分量,而为股票Si的每期收益率序列,其中每期的收益率为
  可见IC值的绝对值越大股票收益率就越高,故使用IC值的绝对值去判断因子与股票收益之间的关系。由此定义每个因子针对全市场所有股票的 IC 显著性为
  显著性越大表明该因子与股票价格之间的相关性就越高,则其对股价的预测能力就越强。通过计算因子库中500多个因子的IC显著性,本文筛选出最优的20个候选因子(见表1)。
  对于IC显著性大的因子还需要进一步考察其选股能力的实际表现,即观察因子值高的股票是否能够保持盈利。为此本文建立了单因子选股模型(详见模型1),并利用样本区间的真实市场数据,对表2中的因子逐一进行回测分析。
  模型1 单因子选股模型
  1.手续费为双边3‰,每月月初调仓。
  2.在每月最后一个交易日计算股票的因子得分。
  3.分值最大的前3%的股票作为备选股票池。
  4.在下月首个交易日,以当天的收盘价将持仓股票更换为备选股票池中股票。
  5.对历史收益率进行回测并计算夏普比率。
  其中第2步的因子得分是通过对原始数据进行预处理之后得到的一个数值(详见算法1)。
  算法1 计算单只股票的因子得分
  1.提取之前30个交易日的原始因子数据。
  2.按照第一节的方法进行去极值与标准化处理。
  3.以最后一个交易日对应的数值作为因子得分。
  由于夏普比率能够同时反映出投资的收益与风险,故本文以此作为度量选股能力的指标,并据此选取夏普比率最高的前6个因子作为最终的有效因子,分别记为Y1,…,Y6(见表2)。
  四、主成分分析及多因子选股模型
  为防止不同因子之间存在内在关联而导致信息重叠,本文利用样本区间内的月度数据对上述有效因子进行主成分分析。
  其次,利用SPSS对于矩阵A进行主成分分析,得到了表3所示的主成分方差贡献累积和特征值。
  由于前两个成分的累积方差贡献率达到了87.291%,已经能够涵盖的绝大部分的信息量,因而选择F1,F2作为主成分,其关于Y1,...,Y6的组成系数分别为:
  如果两个主成分对因子的影响程度相似,则这两个主成分是很难区分的,为此需要进行适当的坐标旋转,将其换成新的主成分。记,观察发现V的前三行和后三行分别对应平面上两类不同的点。因而构造二阶正交旋转矩阵S,对V进行旋转变换得到,其中为W的列向量,且满足分别只在前三行和后三行的位置上取值最显著,容易解得:
  通过中各分量取值的权重可以看出,与三个价值类因子NegMktValue、MktValue、LFL密切相关,其所包含的信息主要为公司的基本面信息,因此称为价值因子。而与三个技术指标类因子LINEARREG_INTERCEPT、HT_TRENDLINE、KAMA密切相关,其所包含的信息主要为股票行情K线的基本数据,因此称为技术因子。
  将价值因子与技术因子的值进行等权重相加,作为衡量股票优劣性的指标,由此建立如下多因子量化选股模型(详见模型2)。
  模型2 多因子量化选股模型
  1.手续费为双边3‰,每月月初调仓。
  2.在每月最后一个交易日,根据算法1计算股票关于有效因子的因子得分。
  3.计算出合成因子的值,并以作为该股票的综合得分。
  4.取分值最大的3%的股票作为备选股票池。   5.在下个月的首个交易日,以当天的收盘价将持仓股票更换为备选股票池中股票(根据不同股票价格等权重配置资金)。
  6.对历史收益率进行回测,计算其年化收益率、夏普比率与最大回撤等相关指标。
  五、实证分析
  从整体上来观察上证50指数自2014年5月至今的走势(见图1),可以清晰地看出大盘经历了从大涨到大跌、最后进入一个缓慢盘整的过程。
  因而可以将整个时间段分为3个不同走势的部分,即“牛市”“熊市”“震荡市”,其具体时间分段如下:
  a)牛市:14年5月1日至15年5月31日。
  b)熊市:15年6月1日至16年4月30日。
  c)震荡市:16年5月1日至19年6月30日。
  将模型2分别在这三个时间段上進行回测,结果如下表所示。
  由表4可知,该模型在不同行情下的年化收益率都显著优于同期沪深300指数的收益率。在牛市行情当中,该模型取得了较高的夏普比率和较低的最大回撤率,表明该模型不仅能够获取非常稳定的高额收益,而且具有非常低的投资风险。在熊市和震荡市期间,该模型受行情影响较大,从而导致了收益率与夏普比率的下降以及最大回撤率的上升,但相对于沪深300指数而言,仍然具有明显的投资优势。
  总之,模型2能够很好地适应各种市场行情,不仅获得了超过市场平均水准的收益,而且也完全体现出了低风险性。进而也说明了本文所构造的价值因子与技术因子,在各种行情下都能够较为准确地反应出股票的优劣性。
  参考文献:
  [1]E Fama,K French. Common Risk Factors in the Returns on Stocks and Bonds[J].Journal of Financial Economics,1993,33(3):3-56.
  [2]朱晨曦.我国A股市场多因子量化选股模型实证分析[D].北京:首都经济贸易大学,2017.
  [3]王春丽.刘光.王齐.多因子量化选股模型与择时策略[J].东北财经大学学报,2018,(5):81-87.
  [4]于卓熙.秦璐.赵志文.温馨.基于主成分分析与广义回归神经网络的股票价格预测[J].统计与决策,2018,510(18):168-171.
  基金项目:北京师范大学珠海校区教师科研能力促进计划项目。
  作者单位:北京师范大学珠海校区应用数学学院
其他文献
摘要:随着大批外资撤离制造业,我国的就业水平、产业转型和经济结构等都发生了重要的变化。最近几年以来,部分世界知名企业纷纷撤离国内市场,社会各界人士高度重视“外资撤离潮”。实际上,外资撤离在一些低端制造业当中体现比较突出,并不是在整个中国市场当中。在这种情况下,国内制造业所面临的不仅仅是挑战,更是产业升级的大好时机。国家和企业都需要及时采取措施和手段,机智灵活地面对新的市场格局。  关键词:外资撤离
期刊
摘要:国内有关资产配置的研究成果主要集中在风险平价模型、B-L模型等方面,但这种研究方法存在一定的局限性,难以根据投资者的实际情况得出相应的资产配置比例。本文通过使用Kelly公式计算资产增值率得到目标函数和利用CVaR风险度量方法进行风险控制来构建数学模型,基于粒子群算法的多目标搜索算法来求解多目标优化问题,得到非劣解。  关键词:粒子群算法 多目标搜索算法 资产配置  一、研究现状  我国对资
期刊
摘要:REITs代表着当前全球房地产领域最先进的领跑者,它可以最大限度的保证政府利益,并能有效的实现整个房地产行业的规范。由此可见,加快REITs立法步伐,对我国房地产行业的发展有着重要的意义。本文简单概述了房地产信托投资基金,分析了我国REITs组织方式和流通模式,并且提出了政策和法规完善意见。  关键词:房地产 信托基金 组织方式 流通模式  在经济转型背景下,房地产企业应该对投资风险引起高度
期刊
摘要:近年来,随着我国发债市场的不断扩大发展,债券种类不断增加,发债主体也随之多元化。以2014年“超日债”打破刚性兑付为起点,在面临全球经济增长速度放缓,我国宏观经济调整,部分产业面临结构性转型的大背景下,债券市场违约事件层出不穷。本文将在梳理目前我国债券违约现状和原因的基础上,对我国违约债券的现有处置方式进行分析,对创新处置方式进行探讨。  关键词:债券违约 债务重组 资产管理公司(AMC) 
期刊
摘要:本文针对保险公司财务风险管理,首先简要介绍了保险公司财务风险的主要表现形式,并就保险公司财务风险的预警防范及有效应对管理,进行了详细论述分析。  关键词:保险公司 财务风险 防范控制  在当前保险行业领域快速发展的时期,越来越多的保险公司经营管理已经从传统的粗放经营管理向着集约专业和精细管理的方式转变。但受到保险公司经营所面临外部复杂市场环境等多方面的影响,保险公司在经营过程中不断扩大投资规
期刊
摘要:通过社会调研发现,随着国家对创新创业的鼓励和减税政策的推进,税费、生产及采购等成本已经不是制约科技型小微企业发展的主要因素,而技术、时间和信誉三种因素对其发展造成的成本压力却不可忽视,甚至可能影响到企业的存亡。本文通过案例介绍了三种因素的影响,并给出解决对策。  关键词:科技 小微企业 成本  民营经济是推动我国发展不可或缺的力量、创业就业的主要领域、技术创新的重要主体和国家税收的重要来源[
期刊
摘要:本篇针对为保证农村扶贫项目精准落实中,多次对同一项目进行审核的现状与审计效率受到制约之间的矛盾,做进一步的探讨和研究。主要通过实现扶贫项目的相关数据电子化、中标单位由上级政府统一协调、建立事中监督体制以及增强审计工作重要性的意識形态建设四个方面,解决两者之间的矛盾,从而提高扶贫项目的审计效率,确保扶贫项目精准落实。  关键词:扶贫项目 审计效率 审计成本  为如期打赢脱贫攻坚战,实现全面建成
期刊
摘要:为加快实现我国经济稳健增长,国家陆续发布出台多项监管信贷政策,控制房地产市场价格过快上涨。本文主要重点分析了部分央行金融刺激政策对房地产行业融资的直接影响,并详细列举了在信贷政策持续收缩的大背景下可行的房地产行业融资支持工具,期望为当下房地产融资业者提供合理的房产融资支持工具使用建议。  关键词:宏观经济 政策收缩 融资工具  近年来,中国经济在快速增长的同时也伴随着外部环境一系列不确定因素
期刊
摘要:资本战略与资本运营是企业成长过程中无法回避的经营管理课题,本文旨在通过介绍两者的特征与关系,以及对企业资本运营目标和必要性的阐述,重点指导企业制定适应不同发展阶段的资本战略,结合案例的形式,多视角分析如何规避资本运营过程中的风险,以期达到企业资本战略的有效落实。  关键词:资本战略 资本运营 利润最大化 股东权益最大化 企业价值最大化 风险控制 公司治理  诺贝尔经济学奖获得者施蒂格勒曾指出
期刊
摘要:西方经济学是财经类专业的基础与核心课程,目前绝大部分院校都选用高鸿业主编的《西方经济学》作为本科教材,该教材国内发行量最大、使用最广,此教材虽有优点,但也有诸多缺陷,本文对此进行了具体分析,并提出了修订建议。  关键词:西方经济学 高鸿业 修订建议  西方经济学是经济管理类专业的基础核心课程,特别是对经济类专业来说,西方经济学是重中之重,不仅是本科阶段的核心课程,也是硕士生、博士生阶段的核心
期刊