论文部分内容阅读
互联网的迅速发展带给人们更广泛的情感宣泄和观点发表的平台;面对涌现的网络评论,政府、厂家和消费者都希望了解大众对其舆论、商品或服务的态度。而单凭人工方式去整理和分析这些海量评论的情感倾向几乎是不可能的,因此人们迫切需要一种能够自动对评论文本的情感和态度(支持或反对)进行分析的技术,即文本倾向性分析技术,又称为意见挖掘。针对互联网上的评论文本,本文从词汇、句子和篇章三个层次对其进行倾向性分析。首先针对基于固定基准词的词汇倾向计算方法对基准词依赖过大的问题,以词性为依据,提出基于动态基准的词汇语义倾向性计算方法。然后构建双重动态基准----领域基准,计算领域文本内极性词汇的语义倾向,阐述了基于领域基准的文本倾向分析方法。最后针对基于领域基准的文本倾向分析方法表现效果不佳的问题,提出了情感递交ES算法挖掘句子主题,计算主题倾向,设计了一种主题情感计数SEC策略实现句式结构化分析下的文本倾向分析。实验结果显示基于句式结构化分析的文本倾向分析方法的优势;实验召回率说明情感递交ES算法对包含情感倾向的评论文本非常敏感,同时极高的准确率验证了本文方法的有效性和可行性,而且表现出来的稳定性也说明其能够应用到更广泛的领域。