论文部分内容阅读
目前,互联网技术飞速发展,网络社交媒体如雨后春笋般涌现,民众可以随时随地通过社交平台发表自己对时政热点事件的观点和看法,舆情信息以指数级的速度增长。由于舆情信息的瞬时海量以及格式多样性等特点,如何从海量的舆情信息中捕捉民众的情感态度,挖掘网民对时事热点的情感态度并且对有价值的关键信息进行提炼分析,从而引导正向的舆论传播,是目前一项亟待解决也极其重要的研究课题。本文对比分析了国内外对于自然语言处理情感分类问题的研究现状和几种深度学习神经网络模型方法的改进思路,研究了前人对于中文文本网络舆情的分析思路和成果,在此基础上对基于深度学习的中文文本情感分析算法及其应用于某一特定时事热点事件的舆情分析进行研究。本文首先对深度学习的相关理论进行了阐述,深入剖析CNN、LSTM两种典型情感分类算法的数学公式;构建了 CNN、LSTM、以及BILSTM三种深度学习情感分类模型,实现了针对中文文本的文本预处理、中文分词和词语词向量等操作环节,并通过中文情感三元分类标准数据集进行训练,介绍了分类评估指标并对三种情感分类模型作比较实验与结果分析,验证模型能很有效地解决中文文本情感分类问题且取得较高的准确率。针对网络舆情分析的应用,首先,爬取、整理实证案例“长春长生问题疫苗事件”的评论文本数据,并人工标注情感极性;通过分析比较三种情感分类算法在标准数据集、真实样本数据集和混合数据集下的情感预测效果,较好地预测了舆情信息的情感极性,从而构建了针对特定新闻事件的深度学习情感分类舆情预测模型;提出在深度学习算法应用的基础上引入统计学时间序列模型,详细介绍了 ARIMA时间序列预测模型建模的流程,将准确率作为衡量特定新闻事件情感分类舆情预测模型好坏的标准,统计每个时间节点准确率数值作为原始时间序列,进行差分处理和时序预处理检验等操作;对得到的平稳化非白噪声序列进行建模和预测,并对四组预测实验的结果作比较分析并得出分析结论。预测结果能较好地体现情感分类舆情预测模型对民众情感捕捉的大致趋势,同时也基本符合时间序列预测的典型特点。