【摘 要】
:
近年来,用户生成内容(UGC)概念深入人心,促进了WEB2.0互联网技术的飞速发展。互联网不仅是网民获取信息的知识库,更成为网民表达观点、交流看法的互动舞台。人们进行评论、表
论文部分内容阅读
近年来,用户生成内容(UGC)概念深入人心,促进了WEB2.0互联网技术的飞速发展。互联网不仅是网民获取信息的知识库,更成为网民表达观点、交流看法的互动舞台。人们进行评论、表达观点时,通常具有鲜明的倾向性(或者叫意见、观点),它往往表达出喜、怒、哀、乐和批评、赞扬等情感,这种信息在产品性能分析、网络民意监测、信息预测等方面具有广泛的应用价值,吸引了大量的学者进行研究。
本文尝试从引入句法上下文信息、跨语言情感词扩充这两个方面对文本情感分类进行研究:
(1)引入句法上下文信息的情感特征研究。
在前人研究中,名词、形容词、动词、副词作为影响句子情感倾向的要素得到充分研究,然而还有一些虚词(比如:叹词、语气词、拟声词和连词)也跟情感紧密相关,却被当作停用词过滤了;另外,否定处理大多基于固定窗口进行研究,这种方法并不能准确反映文中被否定对象的位置。因此,本文利用词汇层的情感信息,挖掘情感虚词的情感色彩、以及通过句法分析的否定词处理来加强语义理解,进行情感分类的研究。实验表明,能取得不错的性能。
(2)基于跨语言语义空间的情感词典扩充研究。
英语国家在情感分析领域的发展条件要远远优于中文,除去英文不需要分词这个天然优势外,更主要还在于各类研究工具和资料比较丰富。相对来讲,中文情感分析起步晚,语料少而分散,因此近年来出现了跨语言的情感分析。跨语言情感分析都是基于互译句子语义相同、情感一致这个前提的,例如:“我很快乐!"和“J am very happy!",所表达的情感都是一致的。本文通过对英汉平行语料进行挖掘,利用共现分析构建了跨语言语义空间,实现了中文情感词典的扩充。实验表明,扩充中文情感词典后,情感分类器性能表现良好。
其他文献
随着互联网技术的发展和云计算技术的出现,越来越多的公司企业开始面对海量数据的处理。传统的集中式处理方式和分布式处理方式很难满足海量数据的计算需求,而云计算技术的发展
编写结构化查询语言(Structured Query Language,以下简称SQL)的语句是测试数据库管理系统(Database Management System,以下简称DBMS)的一个重要部分。自动生成SQL语句可以
围绕可证明安全公钥密码方案的设计与分析这一主题,本报告主要包括以下几个方面的内容:
1.在一般签名方案基础上提出指定条件下k次签名的概念,给出了指定条件下k次签名方
随着时代的发展,信息量也在剧增。在金融服务、电子商务、股票交易、入侵检测、卫星、气象、电信通讯等具体运用中,出现大量的数据,这些数据有别于传统数据,海量而快速达到的数据
颅骨面貌复原是根据人类颅骨特征和颅面形态统计知识来推断出该颅骨的原始面貌。采用计算机技术进行颅骨面貌复原,不但可以减少主观因素带来的偏差、缩短复原时间,还可以使得所
组播是一种高效的通信机制,允许一个发送者同时发送数据至多个接收者或多个发送者发送数据至多个接收者的传输模式,在路由器上合并重复数据以便进行高效的传输,从而有效地节
网络编码技术和机会路由技术是2000年以来逐渐兴起的新技术。网络中间节点将数据包编码后再转发。目的节点收到编码包后按照一定的规则进行解码从而获得原始数据包。网络编码
无线网状网技术是一种新兴的网络技术。它来源于Ad-hoc网络,具有成本低、容易维护、自愈性、可靠的服务覆盖等特点。它和传统的无线网络的一个最大的不同是它的多跳性。现有的
现实生活中的信息,有很多都是以流数据的形式产生的,如传感器网络监控信息、网络安全监控、web用户点击流、气象监控及分析,有着广泛的应用背景。又因数据流具有连续性、未知性
随着社会经济的不断发展,公司的业务也是越做越大,其内部的各种信息资料越来越多,当由于业务需求而派员工去外地出差时,处于安全性和便捷性的考虑,不可能让员工把所有的数据资料都