论文部分内容阅读
在高等教育飞速发展的今天,文献信息资源的保障能力对高校的教学和科研水平起着决定性的作用,其中数字文献信息资源所占的比例在日益增大,读者利用数字文献资源的习惯也在逐渐养成,但是现今国内的C类地址的匮乏导致了许多高校采用NAT地址转换的方式提供广域网服务,这样必然导致了真实IP地址对数字文献资源访问量的不确定性,同时伴随着一些非教育目的的对数字文献资源的商业恶意下载行为,数字资源服务商会根据访问量判定为恶意下载行为后停用对该地址的服务甚至问责和起诉。这势必会影响文献信息资源的服务和保障能力。
本论文以高校为背景,建立一个基于NetFlow的数字文献资源下载流量统计与监测系统,从局域网内部监测疑似或真正的恶意下载行为并加以控制,避免数据服务商问责。
NetFlow与以往的流量统计方法的根本区别是其提出了流的概念,流量统计以流为基础,根据NetFlow提供的流量信息,可以区分各种不同的访问应用并进行短期的实时的流量监控。
流量统计与监测技术主要包括流量采集和预处理技术,数据聚合与存储技术,异常分析与恶意下载判定技术等。对这些技术的研究主要体现在Windows系统平台下的一个原型系统的设计和实现。
原型系统采用的流量采集方式是在校园网路由器上设置NetFlow协议使数据包信息转发到指定地址的指定端口,由接收端流量采集模块通过读取配置文件监听指定端口采集所有源IP地址为数字文献数据库地址的流量信息。
整个原型系统采用windows下的C#与PHP语言进行开发,并且采用了多线程的方式使系统的各个模块并发运行。