【摘 要】
:
面对复杂的犯罪形势,面对庞大的网络警情信息量,通过人工搜集的方法已不可能做到对所有警情信息的及时处理,这使得部分有用的信息流失,对案件及时破获不利。针对这些问题,本
【出 处】
:
华北电力大学(保定) 华北电力大学
论文部分内容阅读
面对复杂的犯罪形势,面对庞大的网络警情信息量,通过人工搜集的方法已不可能做到对所有警情信息的及时处理,这使得部分有用的信息流失,对案件及时破获不利。针对这些问题,本文采用理论分析、实验研究等手段,重点研究了关键技术中的算法与模型,设计了一个网络警情监控系统框架,给出了一种基于WEB文本挖掘的发现方法,对网络警情信息按照文本相似度进行聚类分析,以发现网络警情信息的内在关联,为公安机关进行网络实时监控提供技术支持。本文主要开展了以下工作:首先,从公安工作的实际需求出发设计了一个基于多Agent系统的网络监控系统框架,并对各Agent功能做出了详细描述。其次,对Web文本挖掘的一些关键技术进行研究,包括警情采集、警情清洗、中文分词,同时设计了警情数据的存储结构,并在此基础上给出了通过警情筛选的方法以提高数据的处理效果。再次,通过分析传统K-means算法的特点和存在的不足以及现有的改进算法,提出两点对于传统K-means算法的改进:第一,提出了扇形切分法,用以确定K-means算法的聚类数目k的取值;第二,为优化K-means算法的初始聚类中心,提出基于文本的平均相似度改进的K-means算法。最后,本文设计了一个警情文本聚类系统,并通过实验分析证明了改进K-means算法的有效性。
其他文献
音乐是人类史上一个永恒的主题,是人们情感的寄托和外化。随着互联网的不断发展,人们接触到的音乐信息更是层出不穷,如何从浩瀚的信息中获取感兴趣的内容是亟待解决的问题。
随着计算机技术的飞速发展,开发一个系统软件会涉及越来越多方面的技术和问题,这使得在较短周期内开发出一个成熟的、稳健的软件产品的难度也越来越大。图形用户界面的开发在
随着计算机的在各行业的广泛应用及人工智能的发展,文字识别作为一种能够提高办公效率的有效方法,被各行各业所重视,它倡导无纸化办公,使人们从繁重的文字录入劳动中解脱出来
随着无线网络的不断发展,WLAN的组网方式发生了新的变化,商用模式也出现了新的发展趋势。集中式WLAN成为当前无线网络研究的热点,如何进行智能化网络配置管理以及集中式用户接入
由大量的集成有传感单元、信息处理单元和通信单元的无线传感节点所组成的无线传感网络,具有隐蔽性优良、组网迅速、结构灵活、分布范围不易受自然条件限制、成本低廉、精度高
随着互联网应用的快速发展,人们开始大量使用各种即时媒体技术实现快捷的信息交互。以微博为代表的社交媒体吸引着数以万计的用户,人们可随时随地通过微博表达自己真实的想法
绘画是儿童教育中的重要环节,而线条图形绘制学习是小学生的必修美术课之一。为适应实际绘画的需要,将物体的形状用流畅的线条图形连接起来,随心所欲地表现出看到的和想到的
针对当前已有的基于Wi-Fi室内定位方法,由于定位环境的动态变换,如室内物件摆放位置的变化、无线网络环境的变化、人流量的变化等,存在难以在动态变化的环境下保持稳定的定位
随着互联网的飞速发展,社会进入了一个数据爆炸的时代。这些数据蕴含着大量的价值,如何从这些海量数据中挖掘出有价值的信息成为了当前的研究热点。面对海量的数据,传统的单