论文部分内容阅读
面对当代互联网的迅速发展,使用人工方式处理和获取网络上的重要信息已不能满足人们的需求,所以,人们已经广泛使用自然语言处理技术来处理网络上繁杂的信息。文本情感分析是自然语言处理领域的一个重要研究课题,主要是对网络上的主观性文本信息(如评论,微博等)进行处理。评价对象抽取是文本情感分析的重要组成部分,目的是抽取出主观性文本中每句话所描述的实体及其属性,能够为情感分析的其它任务提供帮助。本文重点研究基于句法结构的评价对象抽取方法,将传统的基于规则/模板的方法与基于统计的方法相结合,从而探索更为有效的评价对象抽取方法。本文方法先对预处理后的结果进行特征提取,再将特征提取的结果与之相应的模板输入到条件随机场模型中进行训练与识别;在特征提取上,通过深入分析主观性文本句中的句法结构,挖掘句法结构信息,在已有特征的基础上加入三种特征;在模板的定义上,本文对多种窗口大小的模板进行了对比与分析,从而选取性能最好的模板,提高评价对象抽取的效果。本文在四个数据集上进行了对比实验,观察当模板相同、特征不同的情况及特征相同、模板不同的情况下的性能变化。通过与对比实验——已有特征相比,本文采用的评价对象抽取方法性能优于被对比方法,最优情况的综合评价指标F值提高了2.3个百分点。