基于优化的IG与RBF的SVM文本情感分类研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:cai8211306
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来网络信息随着互联网技术的发展在急剧增长,同时国家主席习近平也提出了互联网+的概念,因此在互联网中产生了大量、且具有研究价值的文本信息,如互联网参与人员发表的关于个人态度的一些主观信息,包括立场、建议、情绪等。对这些数据进行挖掘和研究具有很大的价值。文本情感分类就是对文本信息进行分析、研究的一种方法,目前主要文本情感分析方法主要分为两类,基于语义理解和基于机器学习的文本情感分类,而本文正是对其中的基于SVM机器学习的相关方法及算法进行研究。在本文中所进行的研究工作主要有以下三个方面:第一,对信息增益(IG)特征选择方法进行深入研究,并对其目前存在的问题提出了相关解决办法和方案。首先本文通过对相关文献的阅读和研究发现特征选择方法忽略了特征项在类别间和类别内分布对特征选择的影响,从而导致特征选择存在偏颇,因而本文在传统特征选择方法的基础上引入了类别内特征频率、类别间的特征频率两个计算因子,进而使其对文本特征进行更合理的选取,将此改进应用到文本情感分类中,寻求分类效率的提高,然后用实验进行分类结果验证。第二,对支持向量机(SVM)中核函数进行了研究,对常用的高斯核函数(RBF)进行微调,并将其应用到组合函数中。首先本文通过对基于SVM机器学习的文本情感分类的研究发现,核函数对将SVM文本情感分类结果具有很大的影响,进而进一步的对常用几种核函数进行了深入研究,发现RBF具有很好的性能,且组合核函数性能比单核更好。但RBF存在着远离测试点处泛化、学习能力衰减过快的问题,因而本文对其进行微调,再利用组合核的思想将调优后RBF分别与多项式核函数(Polynomial)和Sigmoid核函数进行线性加权组合,从而提高分类性能和精度。第三,基于以上两点的改进与优化,本文优化了传统的基于SVM的文本情感倾向分类模型,经过实验后结果分析表明,基于本文方法优化的SVM文本情感分类方法具有更好分类性能和精度。
其他文献
随着互联网和无线通信网络的不断发展,流媒体得到了越来越广泛的应用。目前实时流媒体业务在传输层大多数都使用UDP协议,随着大量流媒体业务涌入网络,UDP流在网络中所占的通
DNA(Deoxyribonucleic acid)计算是一种模拟生物分子结构并借助于分子生物技术进行计算的新方法。目前DNA计算还处于起步阶段,本身还有很多理论和实际问题需要解决。遗传算法
学位
自古以来,气象科学的时效性和准确性影响到人类生产生活的方方面面,决定着社会的发展和稳定。随着时代的进步,人类对于气象科学的需求不断提升,但是某些方法或多或少存在着不
’网格变形是三维模型处理领域中的重要组成部分,它是近几年来计算机图形学中的研究热点之一,很多研究成果已经得到了广泛的应用,如动画制作,影视广告,以及计算可视化等领域
随着电子产品的日益普及和飞速发展,各种电子设备与系统对电源的要求越来越苛刻。开关型DC/DC变换器凭借其效率高、输出功率稳定、纹波较小、集成度高等优点,广泛应用于各类便携式电子设备。如今,开关电源正朝着高转换效率、小体积、高可靠性、模块化和集成化方向发展。本文首先介绍了DC/DC变换器和线性稳压电源LDO的基本原理,深入研究了Buck型DC/DC变换器的相关技术,分析了DC/DC变换器中的功率损耗
大型浮式起重机(简称浮吊)作为特殊工程船舶,在海洋石油开发、大型海上工程、沿海风电设备安装和海难救助等作业中得到广泛运用。但由于大型浮吊海上施工工况复杂,气候环境恶
网页分类可在较大程度上解决信息杂乱无章问题。由于网页中含有较多噪音信息以及网页的特征提取结果影响到网页分类性能,因此,如何降低网页噪音,并改进网页内容的特征提取过
学位
随着移动通信技术的发展,手机的普及率逐年上升,移动增值服务成功的解决了人们希望通过手机获取计算机网络中信息的需求,近年来得到了快速的发展。随着社会发展的加快,对移动