基于集成策略的恶意代码检测研究

来源 :广州大学 | 被引量 : 0次 | 上传用户:atta2002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和第五代移动通信技术的飞速发展,网络应用已经渗透到日常生活中的各个方面,勒索软件、钓鱼邮件和蠕虫等恶意代码对信息安全带来了极大的冲击和破坏。然而,随着恶意代码的自我生存能力逐渐加强,单一检测模型对恶意代码的检测效果往往不佳。因此,研究基于集成策略的恶意代码检测和恶意代码家族聚类技术,对于维护信息安全,减少恶意代码带来的损失,具有重要研究意义和应用价值,论文主要内容和创新点如下:1.通过静态分析和动态分析方法对大量恶意代码进行了分析,系统地总结和描述了恶意代码的字符串特征、文件行为、进程行为、注册表行为和网络行为。2.提出了两种恶意代码的特征集成方法,包括同源特征集成和异源特征集成。同源特征集成是对同一个数据源采用不同的特征抽取算法提取特征,然后构成特征矩阵;异源特征集成是对多个不同的数据源分别采用不同的特征抽取算法提取特征,然后构成特征矩阵。在特征集成之后通过反复与设计的分类模型进行迭代验证,确认集成后的特征是否对模型有正反馈作用,或者对特征矩阵进行特征选择,通过判定新选择的特征对应的重要性分数来衡量特征集成算法的有效性。该特征集成方法能从多个原始特征集中获取更具差异性的信息,同时消除了不同特征集之间因相关性所产生的冗余信息。3.提出了恶意代码检测的集成策略框架。首先,针对多模型集成策略中不同基模型之间可能存在相关性较大的问题,构建了基于弱相关集成策略的恶意代码检测模型,以削减基模型之间的相关性。其次,针对基模型权重如何确定的问题,构建了基于准确率为导向的权重确定方法,同时,采用方差偏差均衡策略解决了模型抖动现象,提升了模型整体的稳定性。最终解决了单一检测算法效果不佳的问题。4.提出了基于降维可视化的恶意代码家族聚类算法。针对未知恶意代码的聚类分析,通过使用降维可视化(t-SNE)方法以确定最佳聚类簇数6),但是当6)非常大时会导致原算法效果不佳,因此在原算法的基础上又提出了聚类初始化提纯迭代改进算法,使得聚类算法效果进一步提升从而适用性更强。最后,对以上提到的算法都进行了详细的实验来进行分析和验证,实验结果表明论文提出的算法相较于传统算法而言,性能上都有了较大的提升。
其他文献
随着我国经济迅速发展和城市化进程的加深,城市居住需求量大大增加,促进了城市住宅的快速发展,同时现代社会中人的思维模式和对待事物的态度发生了变化,重建住户归属感、认同感和良好的住户交往关系,合理有效的规划建设城市住宅,创造出具有充分人际交往空间、有生活温度的住宅成为目前城市住宅建设的重要关注点。研究相关资料,从交往空间定义与作用的角度出发,研究国内外相关交往空间发展进程,总结归纳出当代住宅区景观设计
BGP协议是互联网中广泛应用的域间路由协议,根据CIDR(Conference on Innovative Data Systems Research)报告,全球BGP路由条目在2020年已经超过80万。近年来,路由安全问题变得越来越严重,针对域间路由协议的安全事件往往会导致更严重的后果,特别是恶意操纵路由违反路由策略的攻击更隐蔽,造成的危害更大。这类攻击的直接后果是造成网络流量重定向,引起路由黑
冬季降雪引发了很多冰雪灾害,不仅阻碍出行,而且导致了很多交通事故,于是融雪剂被大量用于融雪和降低冰点,提高冬季道路的安全性能,并且在今后的长时间内都会使用,但是有研究表明融雪剂对沥青路面的性能存在负面影响,因此本文主要研究融雪剂对沥青和沥青混合料的路用性能影响以及融雪剂对沥青损害的微观机理。本文选用氯化钠(NaCl)、氯化钙(CaCl2)和乙酸钾(CH3COOK)三种常用融雪剂分别在1%、2%、3
元启发式优化算法被广泛用于求解实际工程优化问题,具有重要的研究意义。飞蛾扑火优化算法(Moth-Flame optimization algorithm,MFO)作为一种新型的元启发式优化算法,具有结构简单、参数少、性能优越等特点,被广泛用于求解全局优化问题。尽管如此,原始的MFO算法仍存在不足之处。首先,在算法迭代过程中,由于缺乏高质量火焰种群或者飞蛾种群多样性不足,导致种群个体只能探索有限的区
随着工业化和信息化的逐渐融合,使得工业控制系统(Industrial Control System,ICS;简称工控系统)内部控制网络逐渐与外部网络互联互通。不可避免的打破了工控系统原有软硬件的封闭性,容易遭受到更多的攻击。工业控制系统遍及石油、化工和电力等典型行业,是国家工业关键信息基础设施中的重要组成部分,不同于传统计算机网络,工控系统一旦遭受到攻击,造成的后果将直接影响到工业生产甚至是人身安
随着科技的发展,移动终端与智能设备越来越多,万物互联成为了可能,由互联所引起的爆发式的数据增长使得虚拟空间中的数据量越来越庞大。针对于机械工业领域,各式各样的原料、元件、加工工艺、技术性能、国家标准等数据更为复杂多样,如何协助相关领域工作人员从这些数据里精准高效地找出目标数据以及与其有关系的数据就更为重要,这对数据搜索等相关技术的要求也日渐提高,知识图谱技术应运而生。知识图谱可以有效地处理现实世界
伴随着云计算、物联网、人工智能、大数据等技术的不断发展,如今数据中心每天要处理海量数据,这需要极高的网络吞吐性能,对网络技术提出更高的要求。然而随着40Gbps、100Gbps等高性能网卡逐渐部署,传统内核网络协议栈瓶颈逐渐显现出来。由于数据报文传输时需要跨越内核空间和用户空间两级,网络传输导致内核中断产生的上下文切换开销和数据复制的成本增高对数据报文的处理都带来极大的影响,传统的内核网络协议栈已
随着互联网的发展,设备迅速向智能化方向发展,然而这些设备接入互联网后可能会面临一定安全威胁。联网设备识别往往是发起网络攻击的第一步,若能提前发现存在漏洞的设备,切断攻击源头,则可以有效避免安全威胁,保证互联网稳定运行,并且随着第五代移动通信技术到来,网络空间联网设备识别技术对于未来网络有着重大意义。本文通过规则匹配和机器学习两种方法对网络空间联网设备识别课题进行研究。现有设备识别规则匹配方法存在依
随着绿色建筑的高性能发展,绿色建筑运行过程中的室内环境质量(Indoor Environment Quality,IEQ)评估成为重要研究工作,其中室内热环境既影响人员舒适,也影响建筑能源消耗,成为研究热点。近年来对于用户热舒适的评价大多需要用户佩戴传感器(热电偶、智能手环等),会对用户产生一定的干扰和影响。为避免因室内热环境评价对用户造成的干扰,本文研究一种通过用户冷/热动作来预测热舒适的方法。
大学生作为当今社会接触网络信息最广泛的主要群体之一,其身体意象水平和饮食习惯对于促进身心健康的发展有着十分重要的影响。对于离开父母,刚刚踏入社会的大学生而言,正处于培养独立性和个性化的阶段。因此,在复杂多样的网络环境的影响下,他们面临着更多的社会现实要求和更大的生活挑战。这令许多大学生对于自己的身体形象和饮食习惯有着错误的观念。他们渴望被爱、被接纳和被赞赏,却因为错误的观念和方式,导致其产生自卑情