基于文本的行业分类及其动量效应的研究

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:fuuxia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在金融研究中,对股票进行合理的分类,有着重要的现实意义。对于金融市场中的研究者和投资者来说,一个好的行业分类既能帮助构建投资组合以降低投资风险,还有助于通过行业分析获取高额收益。传统行业分类都是基于人们的先验知识人为地对股票进行划分,这些划分方法仍存在诸如对公司业务变化反应不及时以及不能反映公司之间相似程度等局限性。国内外许多学者提出通过聚类算法对股票进行划分,但在过去的研究中大多是基于股票财务数据和历史价格数据,很少有基于文本分析进行股票分类。近年来随着大数据和人工智能的发展,对文本数据的处理能力得到大幅提升,也有越来越多的文本数据挖掘算法被应用于金融研究中。本文从国内公司年度报告文本数据出发,基于年报中对公司的业务描述文本内容对股票进行行业分类,并对新的行业分类方法与传统行业分类方法的分类效果进行比较。此外我们还对新的行业分类方法的行业动量效应进行了研究。本文的主要研究内容包括以下方面:首先基于上市公司年报文本进行行业分类。本文通过网络爬虫获取上市公司每年发布的公司年度报告,对年度报告中《公司业务概要》章节的文本内容进行处理,基于向量空间模型和Word2Vec模型将其转化为计算机可处理的文本表示向量,并通过聚类算法形成固定的行业分类,通过计算相似度矩阵形成网络行业分类。然后对基于文本形成的行业分类与传统证监会行业分类的分类效果进行比较。我们通过对比发现基于文本形成的行业分类提供了更多的信息,在盈利能力、销售增长以及股票市场风险这些方面产生了更大的行业间差异性;在两种分类方法中,基于文本的网络行业分类的分类效果优于基于文本的聚类行业分类。最后本文对新的行业分类的行业动量效应的存在性及其产生的原因进行了研究。我们通过Jegadeesh和Titman(1993)的方法,发现相较于传统证监会行业分类,基于文本形成的行业分类存在更强的行业动量效应;我们对行业动量效应的产生原因提出假设:行业动量效应是由于人们对新信息的反应不足,并通过回归分析验证了我们的假设。
其他文献
伴随着全球经济社会的发展,世界格局的转变,市场制度的规范和完善,我国的资本市场也在全球经济环境的推动下日益发展,愈渐成熟。而机构投资者也在此期间迅速发展,规模逐渐壮大,成为资本市场的中坚力量,实现了股东从“用脚投票”到“用手投票”,主动创造价值的转变。机构投资者越来越主动积极地参与到公司治理的各方各面,通过自身的规模优势和专业优势,一定程度地缓解了信息不对称问题,降低了代理成本,在公司治理过程中发
党的十九大报告指出,要将防范化解重大风险列居于三大攻坚战之首。其中,重大风险中非常重要的就是系统性金融风险。而银行业作为金融行业最核心的板块之一,在我国金融业中一直处于主导地位,若其发生系统性风险事件,将传染至整个金融行业,进而对国民经济造成重大影响。因此,对银行业的监管是重中之重。要想对银行业实行有效的监管,就需要对银行的系统性风险进行深入准确地了解。因此本文以研究银行系统性风险为出发点,从银行
本文研究了上市公司董事会多样性对于公司绩效和管理者薪酬的影响。主要动机在于考察董事会成员特征是否影响了董事会的治理实践,从而影响了公司最终绩效和管理者薪酬激励。在公司治理中,科学地设计管理者薪酬,使得薪酬与绩效挂钩,有利于调动管理者的经营积极性,缓解委托代理问题。董事会在管理者薪酬制定中发挥了重要的作用。董事会成员在性别、年龄、教育、专业背景、任职经历等方面的差异,即董事会多样性,会影响董事会成员
中小企业在国民经济中占据着极为重要的比重,在缓解就业压力、引领创新方面也是重要的驱动力之一。而另一方面,中小企业又由于规模较小、经营不成熟等因素,在我国市场竞争中相对于大型企业处于绝对的劣势地位。商业银行的贷款是中小企业最为主要的融资方式,然而由于中小企业本身存在着资产质量较差、规模较小、抗风险能力差等特点,商业银行与企业之间往往又存在着信息不对称问题,银行往往不能对中小企业的信用风险进行合理有效
随着租购并举的提出,住房租赁迎来了新的发展机遇,租赁在未来将在我国住房体系中扮演重要角色。从政策层面来看,2015年以来,中央和地方密集出台支持住房租赁市场发展的政策,包括但不限于以下几方面:加大对租赁住房建设的信贷支持;加快培育规模化、机构化的租赁企业;规范住房租赁市场的运营;推进REITs(房地产投资信托基金,以下简称REITs)试点等。从需求端来看,伴随着城镇化水平的提高,持续大规模的人口流
总经理是上市公司的核心人物,总经理的离职对于公司业绩、企业价值、资本市场表现、战略选择等方面都具有十分重大的影响。在现今上市公司董事长和总经理离职愈演愈烈的背景下,预测总经理离职行为的相关研究却仍旧处于空白。本文在前人研究结论的基础上,选取五类影响总经理离职概率的核心因子,以2009年至2018年我国A股非国有上市公司为样本,使用逻辑回归的方法,建立总经理离职行为预测模型,预测在对应观测年份上市公
自住房市场化以来,我国的房地产业取得了长足的发展,与此同时全国的房价水平长期处在上升通道之中,房价的持续上涨引起了社会各界的广泛关注。国内外已有许多研究对于我国房价的持续上涨现象做出解释和分析,表明我国房价主要受到土地供给政策、房地产相关税收政策、城镇化进程和国内货币政策等相关因素的影响。近年来,随着国家大力推动京津冀、港珠澳和长三角等都市圈的一体化发展,以及国内高铁和高速公路的快速建设,我国各界
近年来,我国资本市场并购交易的数量和规模不断增加,越来越多的企业选择通过兼并收购的方式实现企业规模扩张、产业链升级和企业多元化的战略转型。并购重组通过规模效应可以优化资源配置,通过引入优质的标的资产优化公司内部管理的效率,但同时,并购重组本身也是一项具有风险的投资行为。因此,在很多并购交易中并购双方会签订关于业绩承诺补偿的对赌协议,这很大程度上缓解了交易双方的信息不对称问题,从而有利于交易的合理定
并购是企业优化资源配置,快速扩大规模,提升发展质量和效益的重要经济手段。然而很多并购并未达到预期目标,甚至损害了公司价值。学者们从不同角度对并购动因和并购绩效之间的关系展开了研究,高管是并购中重要的参与者,也是学者们在研究此课题时经常考虑的因素之一,然而以往的研究缺乏从“代理人”角度系统地研究并购动因及其对并购绩效的影响。因此本文依据已有并购理论及中国实际情况,从“代理人”角度出发研究管理者代理并
随着私募市场的不断发展,风险投资家与风险企业家之间的契约问题被纳入委托代理问题中,发行可转换债券正在成为重要的融资工具,本文先建立风险投资家收益和风险企业家收益的模型,进一步利用风险投资家收益最大或风险企业家收益最小,考虑风险投资家投资和风险企业家努力的不同形式建立相关模型,并利用最优停时理论和动态优化理论,研究连续时间下可转换债券最佳转换时间以及风险企业家的最优努力,表明:(1)当投资家的投资和