基于统计特征的恶意代码分类研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:maomao68
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当下,恶意代码的肆意传播给网络空间安全带来了巨大的威胁。基于机器学习算法对恶意代码进行自动分析是目前恶意代码分析技术的一种研究趋势。由于从恶意代码分类研究中可以获得不同恶意代码家族之间以及相同恶意代码家族之内的特点,而利用这些特点可以使得新型的恶意代码变种更易被检测出来,所以对恶意代码进行分类研究是当前恶意代码研究工作中的重点。然而,当前的分类研究在应对不平衡的恶意代码数据集以及恶意代码特征选择和降维上遇到问题。一方面,由于很多恶意代码家族规模庞大,而一些高危样本却比较稀少,不仅不平衡的数据集容易造成分类准确率的下降,而且提取不够充分的样本特征也会导致分类准确率的降低。另一方面,对于提取得到的特征,怎样进行特征选择和降维从而使得训练时间减小且分类准确率不下降是一个难点,由于可以综合多个方面对恶意代码特征进行提取,难免会造成特征冗余,此时冗余的特征不仅会使得分类速度下降,对分类准确率的提升也没有帮助。针对这些问题,本文从动态特征、静态特征两个方面着手,基于规模较小或者不平衡的恶意代码样本数据集,对恶意代码的特征选择、特征降维算法进行研究和改进,从不同方面提取特征,设计了一套针对不同恶意代码特征的特征选择、降维算法,并利用集成学习算法构建分类模型。针对恶意代码动态特征,设计实现了基于TF-IDF思想的特征选择算法。通过计算所有特征的权重,筛去权重较小的特征,并对剩下的特征进行加权,从而放大特征对分类的影响。使得具有较强分类能力的特征获得较高的权重,使得分类能力较弱的特征获得较低的权重,从而增加恶意代码分类的准确率,同时也减小时间开销。对于静态特征,设计了改进的信息增益算法进行特征选择;对于图特征,设计了基于函数调用图转移概率的特征处理方法,该方法通过统计一个恶意代码样本中每条函数调用序列,设计算法区分不同的函数调用序列,并且利用bin直方图构建恶意代码特征空间。实验证明,提出的特征选择和降维方法不仅适用于普通规模的恶意代码数据集,在规模较小或不平衡的恶意代码数据集中同样表现优秀,且比现有方法有更高的准确率。
其他文献
基于小波聚类的图像分割算法因其具有运行速度快和可以有效提取目标区域的优点而受到广泛地关注。但是小波聚类算法本身存在难以确定划分阈值和聚类精度低的缺点,使用小波聚
本研究旨在探讨在努瓦克肖特巴黎高等师范学院(ENS)提供的职前教师辅导计划的实用性。ENS是毛里塔尼亚的高等教育机构。该学校旨在为受训教师提供教师教育培训计划,这些受训
随着计算机与人工智能技术的快速发展,数字化诊疗技术与装备的研究已经成为当前学术与医疗领域共同关注的研究热点和技术前沿。面对心率、呼吸等生理特征监测存在的束缚性、
近年来,随着高速铁路的不断发展与壮大,高速列车的运营速度不断提升,与此同时,各种列车空气动力学问题也越来越突出。由于列车气动性能与列车头型外形之间有着非常密切关系,利用优化算法将参数化列车几何模型与计算流体力学仿真相结合是列车设计研究的一个新方向。现有高速列车参数化几何模型设计变量偏多、模型表述复杂,设计变量的增多使计算流体力学的计算量成几何级数增加,这在工程上难以忍受。在近十多年内,基于偏微分方
本文根据县级人影作业实际情况,以提高作业实效为目的,通过建立操作规程、提升作业人员的技术水平、建立巡视机制等手段,从而提高作业效能,体现促进经济社会发展、为农服务的
无监督图像翻译是近年来的研究热点,它在没有成对图像作为训练数据的前提下将图像的一种域表达转换为另一种域表达,在图像风格化,域自适应学习等领域有着广泛的应用。目前的
砷是地下水中最危险的有毒污染物之一,严重威胁着全世界数百万人的健康。在中国13个省区的饮用水中已检测到较高含量的砷。水溶液中砷的污染对人类健康和生态健康具有重要影响。长期接触含砷废水可导致癌症、皮肤病,并可对血管、肝肾和中枢神经系统造成严重损害。因此,迫切需要通过适当的方法从废水中去除砷。与其它处理方法相比较,吸附法具有成本低、效率高、操作简单和环境友好等优点,是去除水溶液中砷的最有效方法之一。因
本文以串置翼布局炮射无人机为研究背景,针对低雷诺数下串置翼布局气动特性采用计算流体力学方法进行了数值模拟,对影响串置翼布局气动特性的前后翼水平相对距离、垂直相对距离、翼差角,展长差共4个设计变量进行了分析;以R-90炮射无人机为原型,固定前后翼翼差角,在小攻角范围内对二维串置翼布局进行单点和多点气动优化设计。本文主要研究内容如下:(1)对E387翼型建立二维计算模型并进行流场分析,将数值结果与UI
在计算机视觉研究领域的迅速发展中,显著性目标检测不仅能够提高图像检测的准确性,而且能够进一步加快图像检测的速度。针对现阶段显著性目标检测算法存在的纹理细节信息刻画
近年来,双焦成像在航天遥感领域和智能手机应用领域发挥着举足轻重的作用。双焦成像技术(特别是双分辨率相机)比传统光学变焦相机占用了更小的体积和重量,结合图像处理技术可