基于图神经网络的二进制函数相似度检测算法研究及实现

来源 :浙江大学 | 被引量 : 0次 | 上传用户:wl281472
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
二进制函数相似度检测是指检测不同平台,不同编译器,不同优化选项,不同软件版本的两个二进制函数是否相似。因其能够在无法获得源码的情况下分析二进制函数,所以常用在网络安全和知识产权保护领域中,例如恶意软件分析,漏洞检测,版权纠纷等问题。现有检测方法一部分依赖于图匹配算法,这种方法时间复杂度高且难以迁移到新任务;另一部分是基于神经网络的图嵌入方法,这种方法将二进制函数转换成属性控制流程图,并将其输入到神经网络转换成高维向量。它通过将图匹配过程转换成向量之间的数值运算,提高了相似度的检测效率。但在当前的图嵌入方法中,对属性流程图的特征抽取方法通常是人工提取,会引入人为偏差,且在转换过程中没有考虑到不同结点的重要性差异,因此降低了转换过程的准确性。为了改进人工提取特征引入人为偏差的缺陷,本文设计并实现了基于标准化的无监督特征提取方法。该方法不仅能够避免产生人为偏差,还能够更好的迁移到不同的应用领域。另外本文基于传统的structure2vec网络,通过引入注意力机制来自动学习函数属性流程图中不同结点之间的影响权重。进一步提高了检测精确度。本文主要工作如下:1.提出通用的二进制函数相似度检测框架FuncSim。该框架兼容当前主流的检测方法,并具有高度的模块化和可扩展性。FuncSim将检测过程分为三个模块:流程图抽取模块,基本块特征提取模块及语义转换模块。2.提出基于标准化的无监督特征提取方法。将自然语言处理中的无监督表示方法引入到指令特征的学习过程,同时对指令进行标准化处理,降低指令的特异性,从而提高了指令特征学习性能。实验表明,相比于人工特征提取的方法,相似度检测AUC提升约5%。3.提出基于注意力机制的图语义转换网络。相比于传统的structure2vec,该网络在结点表示过程中不仅能够通过迭代学习邻域结点的信息,还能够自动学习邻域中不同结点对当前结点的权重系数,增强语义转换的准确性。实验表明,相比于structure2vec,本文提出的转换网络的相似度检测AUC提升约3%。
其他文献
本文提出采用计算机辅助的能耗监测系统,有效了解能耗的实时数据和动态分布情况,为能耗统计和节能管理等服务提供重要的基础数据。
磁共振成像(Magnetic Resonance Imaging,MRI)是临床重要的检查手段,使用不同的脉冲序列,可以获得关于人体组织结构、功能、代谢等不同方面的信息。磁共振成像对比度信息丰富
本文分别从病因、症状、治法及方药研究四个方面阐述了更年期综合征与阴虚肝火旺之间的密切关系,认为阴虚肝火旺是引起更年期综合征的重要病机,因此在临床治疗之际,应当重视
重金属污染已引起全社会的广泛关注。镉、铜、镍都是典型的重金属元素,银对人体健康和生态环境的危害性也日益显现。原子吸收光谱法是测定重金属的常用方法,尤其是火焰原子吸
在本文中,我们用密度泛函理论(DFT)中的B3LYP方法,研究了如下两个方面的问题,主要目的是研究相关金属有机化合物参与的反应的反应机理及反应中各物质的分子结构及成键特征。
利用内蒙古正蓝旗地区气象观测数据和牛顿张弛逼近四维同化方法,通过WRF、CALPUFF的模拟,在此基础上结合气象要素、污染物浓度等实测数据,对比了同化前后模拟结果与观测结果
采用热水浸提法从杏鲍菇中提取粗多糖,经纯化得到一种新的多糖WPP2.通过紫外光谱、色谱、质谱、核磁共振、红外光谱、环境扫描电子显微镜(ESEM)和原子力显微镜(AFM)等技术相结合的
作为冷战后国际社会权力结构性变化的一个重要现象,权力流散改变了权力主体的构成,并进而引发了国家在全球或地区公共问题治理方式上的变革。由于国际河流所具有的"整体性"和
"资产为本"的社区发展是一种以内生发展为核心的社区发展理论与实践模式。世纪之交,西方国家面临的挑战使"资产为本"的社区发展成为现实选择。传统"需求"导向的社区发展模式
海外投资保险制度是资本输出国为了保护本国海外投资、消除本国国民海外投资的政治风险而建立的一种保护制度。由于海外投资保险制度在减少海外投资政治风险和有效保护资本输