论文部分内容阅读
随着互联网突飞猛进的发展,人们把在娱乐、生活方面的时间放在了互联网上面,人们对互联网的需求和依赖日益加深,互联网已经逐渐成为人们生活不可缺少的一个角色。最开始,个人只能单纯的从门户网站接收信息,仅仅充当一个接收者的角色;随着互联网技术的革新,个人从门户网站中解放出来,转变为网络的一个节点,既是接收者也是发送者;个人能够在网络上发表自己的看法、意见,能够通他人分享自己的兴趣,人们越来越习惯于在网络上表达自己的情感倾向。而基于这种网络的发展趋势,情感分析也逐渐变成了学术界越来越关注的话题。基于这样的背景,本文也详细的探讨了情感分析的一些方面,包括情感分析的观点分类、挖掘、特征提取等等。在这些基本的理论上,做了如下一些方面的尝试改进:1、预处理模块的设计和实现参考并研究了预处理阶段的相关系统和技术。并结合了情感分析的特点,设计实现了情感分析的预处理基本模块。此模块包含了整个系统的特征选择、特征权重的计算两个方面。同时,对比于传统的情感分析特征,本文也提出了一些其他角度的重要特征,比如:否定词的提取,句法分析结果,词性等等。这些特征最终证明能够有效的改善情感分类的结果。2、词语级情感分析模块的设计和实现在词语级情感分析模块,通过分析了汉语的表达方式上的特点,采用了LMR模板的新概念,并结合CRFs模型对词语粒度下的文档做情感分析。3、句子级情感分析模块的设计和实现在句子粒度下,提出了多分类器融合的算法去解决情感分析的问题。这种算法能够兼顾分类器对不同语料的适应情况,其得到的平均结果能够有效的提高分类的准确率。