论文部分内容阅读
投资者都希望通过分析市场信息获得更高的回报。伴随着传统媒体的衰弱,网络媒体逐渐成为人们主流的信息获取渠道。网络媒体打破了时间、空间的限制,使得人们可以随时随地获得即时的信息。互联网的交互性和开放性为人们提供了表达自身观点的渠道。对于网络媒体发布的新闻,读者可以自主筛选自己感兴趣的主题,而对一些自己不感兴趣的新闻“视而不见”;也可以为新闻点赞或评论,表达自己的观点态度。但是,在大数据时代,以互联网新闻为代表的网络信息正在以惊人的速度增长,早已超出人类个体大脑的处理能力。这就引发了信息使用者认可互联网信息的价值,却无法高效、便捷利用的问题。一方面,新闻媒体帮助投资者获取信息,平衡了市场当中的信息不对称现象,另一方面,新闻媒体也通过对信息的选择和态度的表达,影响了投资者的情感态度与投资决策。因此,对新闻媒体表达的情感进行分析,对于更深入了解投资者的投资决策,进一步更准确地预测股票市场具有重大意义。本研究旨在通过对互联网新闻文本信息的高效利用,探索新闻情感语义与股市指数之间的关系并建立预测模型。针对目前新闻情感分析中忽视读者态度和新闻热度的问题,结合有效市场假说及行为金融学理论,提出了融合新闻热度和读者态度的情感分析方法。具体来说,借助自主建立的高频情感词典、金融领域情感词典,与已有的心理学情感词典作对比,创新性地融合新闻热度和读者态度设计三种情感计算方式:基本权重公式、情感-新闻热度计算公式和情感-读者态度计算公式,进行情感分析;对比了不同情感词典与不同情感计算方法使用支持向量机对股市涨跌的预测能力。实验表明,融合新闻热度和读者态度的情感分析方法能够有效地预测股市指标,1-2天滞后的情感序列都表现出了预测能力,与股市相关的积极高频领域词汇取得了更好的预测效果,融合新闻热度和读者态度的情感分析方法比基础情感计算方法表现出更好的预测能力。