论文部分内容阅读
随着Internet规模的不断扩大、应用不断增多,网络已经深入到我们生活的各方面,给我们日常生活带来极大的方便。许多机构为了保护系统的安全性,采用了防火墙、入侵检测和病毒保护系统等行之有效的安全措施;但是,随着计算机技术的发展,入侵攻击手段日趋高明;再好的安全措施也不能确保整个网络系统的安全。因此,机构应有能力在系统被攻击时能方便而快速地发现对方的攻击行为并采取措施,处理这种紧急事务的关键之一就是利用各种系统记录它们所发生的事件的日志。分析日志数据已成为系统管理员评估系统运行状况和及时发现入侵者入侵行为的重要手段。
文章的研究重点是基于 Web 日志分析基础上的安全预警模型。文中提出了网站逻辑模型和用户访问模型的概念。网站逻辑模型形式化表述网站的逻辑结构;用户访问模型描述用户对Web站点进行访问的路线。本文的主要工作包括以下三个方面:
第一,通过HTTP下载得到Web站点页面的源文件,分析源文件中超链接和服务器控件所包含的URL,确定这些URL与当前页面的链接关系,对每个 URL 分别进行上述分析,由分析结果获得网站逻辑模型。
第二,针对 Web 日志数据进行净化、识别等预处理后,在传统数据挖掘方法基础上,改进挖掘算法并分析日志数据,总结用户频繁访问路径,以此作为用户访问模型。
第三,以图的形式描述网站逻辑模型和用户访问模型,并比较二者之间的异同。如果用户访问路线图是网站逻辑结构图的子图,可以认定该用户活动属于正常访问,否则即可判定用户访问行为异常,系统发出预警信息。