论文部分内容阅读
网络舆情信息监控问题虽然一直受到企业的关注和重视,但是由于网络舆情信息的来源没有边界,监控对象过于广泛,难以实时监控;互联网的发展迅速,技术手段日新月异也为舆情管理工作带来了很大的挑战。由于社会公民与电网企业相互理解和沟通较少,加之其经营特点和经营方式的特殊性,使电网企业较易成为舆情的敏感地和热点地。本文在分析舆情监测管理系统的国内外发展现状和电网企业网络舆情特点的基础上,研究并应用网络爬虫、主体爬虫技术实现了采集系统,研究并应用网页净化、中文分词等信息预处理技术实现了分析引擎。本文在需求分析涉及到了系统的总体功能需求、性能需求和数据库需求研究。本文在总体设计中,以总体框架、用例图、状态图、活动图、E-R图、数据库表、系统架构、工作流程、网络拓扑等方面开展了系统设计。本文在模块设计中,以舆情门户、舆情监测、分类舆情、专题趋势、舆情工作、统计分析、实时更新和系统管理等方面开展了模块设计。本文系统通过J2EE应用服务器为MVC构架和关系数据库予以实现。本文针对采集系统的爬虫策略、任务配置、实时更新,分析引擎的热点话题识别、敏感话题识别、负面研判、舆情预警、焦点转载,舆情应用的舆情门户、分类舆情、专题舆情、舆情工作、统计分析、舆情搜索、系统管理等方面,较为系统地阐述了模块的实现。最后在研究开展了系统测试的测试环境、功能测试和性能测试的基础上,研究了系统的有关常规运维和应急预案。本文实现的系统已应用于吕梁地区的电网公司舆情监测运行管理中,且系统具有响应及时、研判准确、界面良好等优点。