论文部分内容阅读
金融市场的敏感性要求投资者具备快速敏捷的判断力,互联网信息的即时性有助于投资者快速决策,财经信息通常是股民抛售或买进股票的指导手册。在信息获取日益便利的背景下,股票投资者在进行投资决策前一般会对社会环境和具体行业发展进行预判,而这一过程需以全面的信息搜集为基础。大部分股民无法直接真实了解上市公司的实际情况,互联网新闻作为了解社会、行业、公司情况的一个渠道受到股民的广泛关注。本文的研究内容主要分为两个方面,一方面是财经新闻细粒度情感分析的研究,另一方面是情感倾向强度对股市波动的影响研究。本文首先对情感分析和媒体对股市影响的研究现状进行梳理,并对研究所涉及的相关理论基础和技术方法进行介绍。在新闻细粒度情感分析的研究中,本文首先对新闻文本进行预处理,对新闻内容进行分类,并基于特征词识别提取主观性内容,为新闻文本降维;其次基于句法和语义依存关系分析,采用条件随机场模型抽取评价对象,提出一种规则抽取算法用以提取评价短语;此外提供了一种细粒度情感倾向强度量化方法,基于情感词典实现对评价短语的情感倾向性判断和情感强度计算,并基于机器学习SVM实现对评价短语的情感倾向性判断,将两种方法得到的情感倾向性判断结果进行对比,发现第一种效果更好。在情感倾向强度对股市波动影响研究中,本文首先提出一种融合网民关注度的财经新闻情感强度计算方法,可实现将财经新闻情感倾向强度转化为网民情感倾向强度;其次将网民情感倾向强度作为外生变量X,加入到个股对数收益率时间序列和个股换手率时间序列中,构建ARMAX-GARCH模型,从而研究网民情感倾向强度对个股对数收益率和个股换手率的波动影响。实验表明,网民情感倾向强度与个股对数收益率波动和换手率波动都有较强的相关性,但网民情感倾向强度对二者的影响效果不同。网民情感倾向强度对个股对数收益率的波动影响具有普遍滞后性,滞后期一般为1-2天,而网民情感倾向强度对个股换手率的波动影响主要反映在当期或滞后1天。