恶意PDF文档的静态检测技术研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:sansancaicai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的高速发展和办公自动化的日益普及,全球电子文档分发的开放式标准已经变为PDF(portable document format)文件,PDF文件是基于PostScript文件格式之后的一种新的输出文件格式。但是PDF文档在为人们的工作和生活带来许多便利的同时,同样也产生了很多问题。其中,尤其以恶意PDF文档所造成的危害最大最广,给企业和用户造成了巨大的不可挽回的损失,给互联网应用带来了严峻的威胁和挑战。因为恶意PDF文件对计算机的严重破坏性,对恶意PDF文档的检测已经成为了计算机安全领域研究的热点。在本文中,首先介绍了PDF文档的物理结构和逻辑结构,并对PDF文档就攻击方式和检测技术进行了研究,在此基础上,给出了一种基于分类器级联的恶意PDF文档静态检测模型。该模型主要分为三个模块:数据预处理模块、基于N-gram算法的特征提取模块和基于分类器级联技术的PDF文件识别模块。在数据预处理模块中,本文给出了一套完整的针对PDF文件中JavaScript代码的处理方法以得到原始的JavaScript代码。在基于N-gram算法的特征提取模块中,本文针对两种不同的PDF文件攻击方式,采用两种不同的N-gram特征提取方法。在基于分类器级联技术的PDF文件识别模块中,本文针对两种不同的PDF文件攻击方式,采用两种不同的分类算法建立分类模型,并对两个不同分类模型的结果进行处理,得到最终的识别结果,有效地避免了使用单一分类算法的不足。经过性能对比,本文提出的恶意PDF文档静态检测模型,在恶意PDF文件检测时,检测率优于现有的静态检测模型,检测时间低于现有的动态检模型统。
其他文献
评价Ad Hoc网络的算法或协议优缺点主要通过仿真的方法来对比,但是模拟工具的不同和设置参数的不同容易使对同一个算法或协议的模拟结果也不同,因此进行参数初始化的时候可以通
基于图像的信息隐藏技术已经比较成熟,应用也日益广泛,但基于动态视频图像的信息隐藏技术目前还处在研究阶段。信息隐藏比加密技术更具有生命力,它能在不改变原始文件的大小的情
无线Mesh网络是一种新兴的并具有广泛应用前景的无线网络技术。但目前无线Mesh网络的发展还并不十分成熟,仍有许多问题亟待研究和完善。而路由技术是影响无线Mesh网络性能的关
如今,过程控制系统中的历史数据库(简称过程控制历史数据库)在信息化时代的工业生产中显得越来越重要,它专门用来存储和管理生产线中的过程数据,如温度、压力、流量、密度等。一
文档复制检测技术是数据安全领域中一个重要的研究课题,是保护知识产权和提高信息检索效率的一种有力手段。文档复制检测就是判断一篇给定文档是否抄袭﹑剽窃或者复制于另外一
作为知识的直接来源,各类文本文件是P2P文件共享系统中重要的共享资源。对于文本文件的有效利用,依赖于高效的信息检索技术。因此P2P系统中的信息检索(Information Retrieval
图的Ramsey数研究是Ramsey理论的一个重要研究方向。该问题不仅在数学的发展中有重要的理论价值,而且在信息论和理论计算机科学等许多领域中也有重要的应用。Ramsey数的确定是
CMMI是由卡内基.梅隆大学的软件过程研究所提出的一套软件过程评估与改进的模型,其根本目的是改进软件过程,有效地控制软件产品开发和管理的质量。软件过程改进的依据是软件过程
人们在使用宽带IP网的时候,网络运营商必须通过认证计费系统对用户进行身份验证和计费。而目前的认证计费系统都是单一针对有线宽带接入或者单一针对无线宽带接入进行认证计费
随着信息技术日新月异的发展,人类正在进入以网络为主的信息时代,基于Internet开展的电子商务已逐渐成为人们进行商务活动的新模式,越来越多的人通过Internet进行商务活动,电子商