基于异常特征检测的恶意网页识别技术研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:yeaGem
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网应用的日益发展,人们的生活和工作已经越来离不开互联网。我们每天都需要通过浏览器访问网页。但是互联网上有着大量的恶意Web服务器,当用户访问到这类的服务器时,用户的计算机就会受到各种各样的攻击。一旦攻击成功,恶意网意可以使用户的计算机出现软件故障,甚至导致用户的隐私泄漏、帐户被盗等各种后果。这些恶意网站的存在,对普通用户的计算机安全是一个巨大的威胁。因此,我们需要对互联网上的恶意网页进行识别、检测和过滤,以保障人们的上网安全。   随着恶意网页识别技术的的不断研究和发展,各种类型的识别技术都已经得到研究人员的实现及具体应用。如基于动态行为特征的识别系统,启发式检测系统等。然而,如何架构一个恶意网站自动审核的系统环境,使得该系统能够以高识别率、低误判率来采集恶意网址,是仍值得这方面研究人员的继续努力的一项工作。   本论文主要分析了现有的恶意网页检测技术以及主要的网络恶意代码的攻击原理和变形隐藏技术,提出现有一些系统的不足。并基于目前主要的静态特征和动态特征识别技术,通过仔细分析恶意网页在各方面表现出的异常特征,对这些特征进行提取,从而形成一种基于异常特征的识别方法。本文重点介绍恶意网页从载入、环境准备再到利用漏洞及网页最终显示的过程中所表现出来的异常特征,并结合仿真客户端和高性能爬虫,提出一个二级马尔可夫特征链的检测算法,来构建一个恶意网站的检测和采集系统。   与传统的检测方法相比,该检测系统主要优点在于一方面不具体区分恶意网意的静态和动态特征,而是跟踪分析客户端载入网页整个过程当中所表现出来的异常特征。同时,使用二级马尔可夫链模型算法来判断网页是否为恶意网页,避免传统静态检测方法检测效果不佳,而动态检测又存在着性能瓶颈的缺陷。另一方面在检测系统中配合模拟的浏览器,能够大幅提高识别率,对传统客户端蜜罐由于资源模拟不够而造成的漏检有很好的弥补。另外,通过在后台布署一个真实的浏览器,不仅可以识别出基于下载行为驱动的恶意网页,也能够主动识别出钓鱼等仿冒网站,提高该检测系统的实用性。
其他文献
互联网的飞速发展导致了“信息爆炸”这个现象的出现,人们想要获得自己需要的信息的复杂度越来越高。传统搜索引擎的出现给人们的生活和工作带来了很大的便利,但是随着互联网产
随着多媒体信息技术的快速发展和互联网的日益普及,数字图像信息海量增长,图像的存储和管理已经成为一项繁重的工作。如何从庞大的网络图像库中快速而准确地找到用户所要查询
目前,在玻璃生产过程中,配合料的加热、熔融和硅酸盐的分解以及玻璃液的澄清都是在熔窑内进行的,这种生产工艺已成为制约玻璃工业生产的瓶颈,具体表现在两个方面:一方面生产规模受
近年来,随着农业结构调整和居民消费水平的提高,生鲜农产品的产量和流通量逐年增加,全社会对生鲜农产品的安全和品质提出了更高的要求。冷库是生鲜农产品储存的基础设施,目前国内
当今,Hadoop集群在大数据时代下已经广泛使用,互联网公司对数据的处理和分析广泛使用Hadoop集群。一旦Hadoop集群失效,会导致数据的丢失,带来工作上的不便,甚至带来重大的经
随着虚拟仿真技术的不断发展,越来越多的研究者致力于将真实数据引入到虚拟仿真中,以达到更真实的仿真效果。但针对大规模数据以及仿真模型数据的研究仍存在仿真时效性较差、
计算机网络例如点对点(p2p)网络,它的每个节点可以作为网络中其它计算机的客户端或者服务器,允许它们之间相互共享服务或共享文件,这被认为是协商目标。在同意对一个协商目标进
随着海量数据量的增长,使得人们查找有用信息越来越难,速度也受到挑战,文本自动分类技术的研究也越来越受到人们的重视。文本自动分类方法很多,如:向量空间模型法、基于关联的
节点定位是无线传感器网络实现高层应用的前提和基础,但是节点定位算法在设计之初对安全性问题考虑不足。节点在定位过程中容易受到来自网络内部或外部的攻击。错误的定位结
近年来提出的压缩传感理论颠覆了传统的奈奎斯特理论,已成为信号处理领域研究的热点,然而,相关的研究毕竟还处于初步阶段,进一步探讨如何提高压缩传感重构准确度,具有十分重