论文部分内容阅读
随着我国的现代化建设和科技兴国的不断深入,社会经济、科技技术都得到迅猛发展,数据挖掘也融合数据库技术、人工智能、信息检索、统计学、数据可视化、面向对象方法、机器学习、高性能计算等最新技术,形成了独具特色的研究分支。与此同时,犯罪行为的高智能化、高科技化、动态化、组织化和职业化趋向也越来越明显,违法犯罪行为的高速变化对公安警务改革、侦查谋略、执法效率、犯罪控制和防范策略等提出了严峻挑战。目前,很多国家和城市都加大了犯罪数据挖掘工具的研究投入,都更加重视犯罪数据的搜集、分析和挖掘,积极的研究开发犯罪行为分析系统。本文基于盗窃案件占多发性侵财案件总数绝大多数,和入室盗窃案件容易诱发其他恶性案件的现状,将数据挖掘技术中的关联规则挖掘、分类分析、聚类分析三种技术应用到对入室行窃犯罪行为数据的分析中,开发了一个操作简单、智能化的犯罪行为分析系统,帮助用户对入室行窃犯罪行为的分析和预测。系统的主要功能包括:(1)入室行窃犯罪数据的关联性分析,利用FP-Growth算法对犯罪行为的基本特征属性进行分析,首先产生所需要的频繁模式;然后,由频繁模式树生成关联规则,挖掘隐藏在数据间的相互关系来找出犯罪行为之间的关系,如:哪类人员在相同作案时间段发生的犯罪活动中易成为受害者。以得出的强关联规则形成的知识库就可以有效的帮助有关执法部门分析案件,更有针对性的部署决策,并起到提前预防犯罪的作用;(2)基于分类技术的犯罪行为分析,采用决策树C4.5算法分析犯罪人员的基本特征属性,例如:犯罪人文化程度、有无特长、有无固定职业、犯罪人经济状况及犯罪程度,来挖掘引发不同程度犯罪的各个因素之间的相互关联,发现哪些因素可能频繁起作用,可以协助相关部门制定相应的政策,如:加强法制教育、加强技能教育、加强公众保障措施等;(3)基于聚类技术的犯罪行为分析,利用基于密度的DBSCAN聚类算法对案件信息进行分析,使数据中的对象具有较高相似度的聚成一类,那么同一类别中的犯罪行为具有较多的相似性,帮助办案人员找出可能的犯罪团伙。