论文部分内容阅读
随着微博等自媒体平台的迅猛发展,社会热点事件的传播速度越来越快,影响范围也越来越广。识别这些热点事件中的评论对象并对其进行分类可了解公众对事件责任主体的认定倾向,是舆情传播的重要研究内容之一。特征提取是文本分类的重要一环,传统的信息增益方法只考虑类别对特征的影响,而大量短微博中的特征很可能会被忽略,影响分类效果。论文在信息增益方法的基础上加入文本长度对特征的影响,在新浪微博上的实验表明,新方法的分类准确度较传统的信息增益方法有所提高。