【摘 要】
:
互联网作为人们信息交流与资源共享的平台,保存了大量含有主观性信息的数据。如何从这些海量数据中提取出人们感兴趣、携带观点的文本,并对其进行情感分类是目前研究的热点之
论文部分内容阅读
互联网作为人们信息交流与资源共享的平台,保存了大量含有主观性信息的数据。如何从这些海量数据中提取出人们感兴趣、携带观点的文本,并对其进行情感分类是目前研究的热点之一。传统的情感分类方法主要有:基于情感词典的情感分类方法、基于机器学习的情感分类方法。近年来,随着深度学习技术在机器翻译、语音识别、图像处理等领域取得巨大成功,很多研究者把深度学习的方法引入到自然语言处理中。本文采用深度学习技术在清华酒店数据集和采集的豆瓣影评数据集上进行了情感分类研究。针对传统的特征抽取模型丢失词语原来的顺序性,忽略了词语的语义信息的特点,本文采用随机向量、word2vec和词对向量模型,分别在本文设计的长短记忆门型递归神经网络(LSTM-RNN)及门阀单元型递归神经网络(GRU-RNN)两种深度学习模型上进行了模型训练及分类验证。实验结果表明,采用深度学习方法相比传统情感分类方法其分类准确率提高了5个百分点。
其他文献
本文结合实际的科研项目,对笔迹鉴别中手写笔画特征描述与提取及相关理论进行了研究。在该研究中,取得的成果和贡献如下: 1、提出了笔画特征抽取的实现策略,即:以直观特征为主,
为了支持在移动终端上越来越丰富的数据业务,移动终端上应用运行环境也越来越复杂。但是不论应用运行环境有多复杂,它都可以根据所支持的应用程序执行指令方式不同进行分类。一
非线性科学是研究非线性现象共性的一门新兴的交叉学科,其主要研究内容包括孤子、混沌和分形,同这三个概念相对应的理论共同构成了非线性这门学科的理论基础.本文主要介绍了
聚类分析是研究数据聚簇模式的技术.由于它始终是数据挖掘研究的重要内容、手段和工具,因此,聚类分析又是一个被不断探索并充满创新的研究主题.离群点检测是研究包含在数据中
自二十世纪九十年代起,随着电子信息等技术的发展,各种随身电子设备,例如智能手机、多媒体播放器等各类便携设备的运算和存储能力得到了巨大的进步。用户希望像在台式机或者笔记
近年来,随着网络的迅猛发展以及各种新型网络业务的出现和广泛使用,IP网正在从当初单纯传送数据向可传送数据、语音、活动/静止图像的多媒体网络转变。目前的IP网络所提供的是
随着分布式计算技术的不断发展,分布式计算环境逐渐成为企业信息化建设的基础结构,企业业务过程越来越多的构建在分布式计算环境之上,跨越多个不同的分布式技术。 本文对分布
当今用于手工计算的空间角度的计算已有很多的方法(如:六面体法、投影几何法等),但这些方法用于计算机的算法还需作很多的工作。可以说在当今的工业设计制造中,空间角度的计
本文首先分析了网络故障相关的基本概念:网络故障诊断体制和故障定义、分类。在研究实现这些网络故障诊断的基本功能的基础上,研究了基于CBR的智能故障诊断技术,提出了故障案
数字化时代已经来临,互联网也在逐渐走进人们的生活,电子图书便是数字化时代技术发展的必然产物。和纸制书相比,电子图书借助计算机网络,使人们能更充分地享受到数字化资源存