论文部分内容阅读
随着WEB2.0时代的到来,互联网成为人们获取信息的主要媒介。微博以其病毒式的信息传播方式,短文本、口语化和多媒介的使用特点被人们广泛使用。近年来,针对微博进行的现实感知、商业营销和社交网络的研究越来越多。本文基于新浪API采集微搏数据,选取“北京721特大暴雨”为研究对象,进行突发事件情感分析的相关研究。
本研究主要分为两大部分,首先是对同突发事件情感分析相关的理论和技术进行研究,并构建相应的研究模型。其次,在理论研究模型的基础上,对“北京暴雨”的微博数据进行实证分析。具体研究工作和结果有:⑴通过文献调研法剖析微博的特性和功能特点。对获取微博数据的两种主流方法,基于微博API法和网络爬虫抓取法进行对比分析。⑵深入研究了情感分析理论的过程,对中文分词、构建情感词典、情感特征词选择、特征权重计算等步骤进行了概括。在对比了多种情感分类方法的基础上,根据文本数据的特点,选取了朴素贝叶斯模型作为实证研究的分类基础。⑶以“北京暴雨”为目标事件,对选取的微博数据按照情感分析模型,进行实证分析研究。在分词和词频统计的基础上,根据训练集数据构建了朴素贝叶斯概率模型,并以此为基础对测试集数据进行了情感分类计算。⑷在情感分析的基础上,根据关键词对微博内容进行了主题分类。采用比较分析的方法,对主题间的情感属性进行了研究。对突发事件中群众的情感走向和关注对象进行了分析,并提出了一些建设性意见。