基于卷积神经网络的恶意代码灰度图像分类研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:zhongyi02w
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网已经迅速成为日常生活中不可或缺的一部分,并且我们对互联网的依赖正在持续增长。与此同时,网络攻击急剧增加,攻击手段日异月更。当前的恶意代码检测技术通常使用传统的机器学习算法,这些算法需要对恶意代码特征进行提取和选择。多数动态分析受执行环境约束,部分恶意代码通过隐藏文件逃避追踪,过程耗时且容易出错。流行的静态分析依赖于人工提取特征,安全性较差,效率较低。面对以上挑战,本文将恶意代码检测结合深度神经网络,主要工作如下:(1)目前针对恶意代码图像进行的分类研究在恶意代码领域总体而言较少,现有的工作仅在Malimg恶意代码图像数据集上进行,而基于图像的恶意代码检测需要其他数据集支撑和验证,本文将在Virus Share网站收集的二进制PE恶意代码处理为灰度图像数据集,提出一种基于卷积神经网络并结合了dropblock正则化与空间金字塔池化的模型。借助卷积操作提取灰度图像特征,利用dropblock算法思想防止过拟合,通过空间金字塔池化处理大小不同的输入并扩展了金字塔的层数,提升了模型的特征提取能力。在基于图像的恶意代码检测场景中,该模型解决了卷积神经网络只能处理固定尺寸的图像,对输入图像进行剪裁或者拉伸操作时,会丢失重要信息的问题。设计了一系列实验,将本论文处理的灰度图像数据集上训练好的卷积神经网络应用到Malimg数据集中,使得Malimg数据集的准确率有所提升。(2)提出了一种基于改进双种群遗传算法的卷积神经网络结构与参数优化方法。该方法将恶意代码检测模型训练过程建模为一个目标优化问题。使用双种群遗传算法,结合精英保留机制设计了基于个体交换的选择策略,该策略可以提高种群的基因丰富程度,提高种群适应度。利用遗传算法优胜劣汰的机制保留优势个体,快速搜索参数最优的卷积神经网络模型。该方法解决了深度神经网络模型在实际训练过程中容易受到训练次数、学习率和权重阈值等因素影响而降低检测效率的问题。实验结果证明,优化过的恶意代码检测模型准确率和整体性能有进一步提升。
其他文献
成人自评(Adult Self-Report,ASR)量表是一套针对成人性情与心理健康的评估量表,主要包括成人焦虑、注意力、内向性格、攻击性行为和侵入行为等方面的自评,目前已被心理学和精神疾病研究领域广泛接受。ASR分数的测定目前还主要依赖于问卷的主观评分,对ASR分数的客观测定将有利于推进对成人心理及精神健康状况的精准判定。静息态磁共振影像(resting state functional Ma
脑肿瘤是一种全球死亡率较高的疾病,对病变组织范围的界定是对脑肿瘤定量评估和制定治疗计划的一个主要挑战。近年来,基于核磁共振成像(Magnetic Resonance Imaging,MRI)的脑肿瘤分割研究因其无创成像和良好的软组织对比度而受到越来越多的关注。核磁脑肿瘤分割是指,基于脑部核磁共振影像,将坏死细胞、水肿、活跃细胞从脑脊液等正常组织中标记出来,从而确定肿瘤范围的过程。目前,常规临床中采
随着我国经济快速发展,交通拥堵问题日益严重。为改善交通拥堵现状,国内外学者积极寻找有效的对策,其中一种有效方法是建立交通出行需求预测模型,分析和掌握居民出行选择的一般规律,进而有效管理城市居民的交通出行。出行目的是引发交通需求的直接原因,研究出行目的对分析居民出行行为具有重要作用。随着机器学习的发展,全连接神经网络展现出其强大的自主学习能力和精准的预测能力,给非集计模型在交通出行行为领域的研究提供
随着人工智能、机器人技术的不断发展和变革,机器人正逐渐进入人类生产生活的各个领域,机器人操作系统(Robot Operating System,ROS)因此得到广泛的应用并受到学术界和产业界的共同关注。其中,ROS安全测试与验证成为机器人操作系统研究领域的热点问题之一。通信机制作为ROS最基础的功能,在保证系统的正确性和安全性方面具有不可替代的作用。进一步说,ROS安全不仅应当从仿真和测试出发来进
移动机器人已广泛应用在医疗服务、餐饮行业、物流运输等领域,先进的机器人技术逐渐代替人工作业。移动机器人的路径规划与轨迹跟踪是机器人自主导航的关键技术,其运动路径是否平滑影响着机器人的移动效果,能够生成符合车辆运动学的可行路径并且稳定跟踪控制是实现的移动机器人自主导航的基础。本文从移动机器人的实际问题出发,以松灵SCOUT通用型底盘为实验平台,在工控机上安装Ubuntu系统,搭载16线激光雷达和IM
随着移动机器人技术的飞速发展与相关研究的逐步深入,移动机器人拥有了更加广阔的应用背景,由此对其结构和功能提出了更高的要求,期望移动机器人具备一定的环境适应性以应对复杂的工作环境。移动机器人的越障能力测试是移动机器人研究过程的关键一环,然而在传统的越障能力测试试验当中,常规方法是让移动机器人跨越特定参数的障碍试验台,再通过人工判定的方式测试其越障性能。由于特定参数的障碍试验台不能根据越障试验需求快速
随着现代电力系统的快速发展,新能源大规模并入电网,特高压交直流混联趋势日加明显,电网互联程度日趋紧密,这使得电力系统规模不断扩大,复杂性大幅提高,愈发接近安全稳定运行极限。且现代电力系统高维非线性,故障发生速度快,响应时间短,这无疑加大了暂态稳定预测的难度。为给故障后的紧急控制留出充足的时间裕度,亟需一种更加快速准确的暂态稳定预测方法。近年来,以数据挖掘和机器学习为代表的人工智能领域得到了迅速发展
随着精神生活的日益丰富,人们对观看电影、电视剧的娱乐需求逐渐增加,以微电影、情景剧为代表的网络短视频也呈爆炸式增长。在这一环境下,预测观众在观看影视作品时视线聚焦的位置变得十分有意义,例如,对于广告公司来说,通过视频中的注视点分析,可以将广告产品在视频中的位置设定的更佳合理。依据观众是否提前知道影片的相关信息,观看方式可分为自由观看和视觉问答两种。现有的动态场景人眼注视点数据集几乎都不是针对影视作
细粒度图像分类在工业界应用广泛,然而,传统的图像分类网络在细粒度图像的分类问题上往往无法达到很好的效果,因为在细粒度图像的数据中经常会出现高类内差,低类间差的情况,加之图像数据的质量参差不齐,图像中存在的噪声往往会掩盖图像内部的细节特征,因此细粒度分类问题十分具有挑战性,也引起了广泛的关注。然而细粒度图像分类网络运用于工业仍面临挑战。在目前的研究中,强监督的细粒度分类网络虽然有着较高的准确率,但却
联邦学习是一种新型的分布式学习框架,它能够解决数据在本地训练而不会泄露的问题,但是它也面临一些前所未有的安全和隐私威胁,例如在传统机器学习中的投毒攻击可以很容易的在联邦学习中实施,因为本地数据对外不可见,恶意的参与者就可以轻易对数据进行篡改实施投毒攻击。另外由于服务端与本地客户端通过模型参数进行通信,恶意的参与者可以直接获取到参数,通过对这些参数进行分析,依旧可以在一定程度上泄露私人信息。因此本文