论文部分内容阅读
互联网已经成为大家一种不可或缺的社会生活方式,它既是大量信息的来源,也是网络犯罪的温床,近年来频发的网络舆情事件,特别是社会民生类的网络舆情事件,对我国公共部门的形象造成了较为严重的影响,也给有关部门带来了很大压力。因此,采取一定的措施来对网络舆情进行正面的引导,及时处理掉那些潜在的危害因素,对我国社会的治安维稳有很重要的现实意义。本论文参考了国内外各个舆论分析系统的不同功能和应用方法,针对网络舆情文本的特点,设计了网络舆情文本多标签标注系统。在进行正文提取、中文分词、去停用词等预处理之后,利用卷积神经网络能高度抽象事物特征、容错性好、自适应性好的特性,对处理好的新浪微博正文进行多标签分类,并在Web页面上展示分类结果以及各类别文本的数量、所占百分比等统计性数据,完成系统和用户之间的数据交互。最终使得有关部门能深入分析网络舆情热点动向,全面而准确地掌握舆情特征,最终实现数据挖掘。通过对网络舆情热点的深入分析,本论文确定了适用于网络舆情文本的分类体系。该分类体系包括了六个主要的类别,分别是资源环境、国家安全、社会稳定、政府执政、日常生活以及个人行为,它们从不同的领域和层次对网络舆情文本进行了划分。在此分类体系的基础上,本论文采取人工标注的方式,对采集到的网络舆情文本进行类别标注,为神经网络的训练和测试提供了可靠样本。经过对网络结构和参数的多次调整,最终成功地训练出了适用于网络舆情文本多标签分类的卷积神经网络,从实验结果来看,效果达到了预期。以网络舆情文本多标签标注系统为依托,有关部门能够全面把握人们对热点事件和民生问题等的意见和态度,以制定切实可行的政策措施,提高服务水平,还可引导善意舆论,遏制恶意谣传,提高自身形象和地位,普及社会主义核心价值观。