论文部分内容阅读
随着网络在国内普及率飞速增长,网络信息量呈几何级数增长,其传播的速度更是其它渠道难以匹敌的,成为人们最重要的信息来源之一。网络也成为金融领域信息重要的集散地,尤其是WEB2.0技术的发展,论坛、博客、聊天室等可以提供互动的技术不断涌现,使投资者可以参与到网络信息的创造、传播及获取的各个环节。论坛是最受欢迎的网络社区之一,众多的投资者在股票论坛中交流信息,分享经验以辅助投资决策,因此对其中信息的获取是了解投资者心理及行为的重要途径。相比国外上百年历史的成熟的金融市场,成立仅二十余年的中国金融市场还处于发展阶段,监管制度不完善,投机者居多。众多投资者通过各种途径获取信息进行交易,作为获取信息的重要方式之一,对股票论坛的研究具有重要意义。行为金融理论认为投资者的心理及行为能够影响股票市场的表现,基于这一理论,本文对国内的股票市场进行了研究。本文提出了自动剔除领域无关评论的方法,成功剔除了84%的股票市场无关评论,并保留了90%以上的股票市场相关信息。本文对比了语义分析方法、机器学习方法及N-Gram方法三种情感分析方法,支持向量机结合信息增益的方法能够获得良好的实验结果。通过单只股票价格影响因素分析,建立股票价格预测模型,能够比较准确地预测股票市场的价格。我们分析了股票价格影响因素,并建立回归模型对其进行预测。结果显示,滞后股票收盘价,情感指数,机构评分、滞后新闻数量能投对股票收盘价格进行解释。通过对通讯行业进行单因素方差分析,情感指数能够影响收益率及波动率。通过对上证指数及情感指数进行领先滞后分析发现,投资者情绪与滞后综合指数相关,与领先个股收盘价相关。