基于中间语言的跨架构二进制相似性检测系统的设计与实现

来源 :浙江大学 | 被引量 : 0次 | 上传用户:yingchaoya
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网和IoT的兴起,市场上的软件越来越多,由于软件复用,基础库中的漏洞可能被传播到成千上万的软件中,其中也包括闭源的商业软件。基于源码的漏洞检测技术在无法获取源码的情况下并不可行,因此需要考虑二进制检测技术。具体来说,二进制相似度检测是指在无需获得源码的情况下,直接对二进制程序分析进而比较其相似性的技术,能有效地针对闭源软件进行漏洞检测。此外,二进制相似度检测也能应用在代码剽窃判定和版权纠纷问题上。
  传统的检测技术通常先从二进制程序中提取特征,然后基于图匹配算法进行相似度检测。然而图匹配算法需要大量计算,精度也无法得到保证。基于图嵌入的检测方法先将二进制原始特征转化为高维向量,然后针对向量展开相似度检测,具有较好的扩展性。然而在目前基于图嵌入的方法中,原始特征仍然是人工提取得到的,特征提取过程会引入人为偏差。此外,从原始指令中直接学习到的特征又会依赖于架构信息。
  为了解决这些问题,本文设计了基于中间语言的无监督学习方法来提取原始特征的方案和一套通用的对中间语言进行归一化和变量改写的方法,然后基于神经网络训练二进制函数相似度检测的模型。在训练模型时,使用Structure2vec神经网络让函数从其函数调用图中的邻居聚合学习,能够更有效地应对程序控制流图的变化。本文的主要工作如下:
  1.调研了二进制相似度检测的相关技术,包括基于原始特征和基于图嵌入的两类方法。
  2.设计并实现了基于VEX的中间语言,并将各架构下的二进制程序转换为中间语言用于特征提取。
  3.针对中间语言提出一种通用的变量改写方法,能有效地对栈变量、临时变量、全局变量进行恢复和改写。
  4.提出了基于Structure2vec的函数调用关系处理方案,增强了相似度检测模型应对控制流图变化的能力。
其他文献
摘 要:工伤认定是劳动行政部门依据法律的授权对职工因事故伤害(或者患职业病)是否属于工伤或者视同工伤给予定性的行政确认行为。劳动者在工作或视同工作过程中因操作不当或其它原因造成了对人身的侵害,为了鉴定该侵害的主体而对过程进行的定性的行为。根据我国的相关规定,一般由劳动行政部门来确认。文章以实践中所遇到的案例为例,对与《工伤保险条例》相关的问题进行了分析探讨。  关键词:工伤认定 工伤保险 具体行政
期刊
摘 要:上市公司的内部控制信息披露是反映企业内部控制实施效果及企业运营状况的重要途径。文章以制造业研究样本为例,通过分析2012年我国内部控制规范体系强制实施前后三年的上市公司内部控制自评报告及内部控制审计报告的披露情况,发现制造业总体内部控制自评报告的披露率较高,2013年达到94.2%;但是从不同板块看,沪市主板的内部控制审计报告披露率逐年增长,2013年深市达89.1%,内部控制实施效果较好
期刊
摘 要:现在的互联网金融可谓异彩纷呈,余额宝引得活期宝、收益宝、现金宝等金融产品不断涌现。微信新增支付功能后,基金公司通过与互联网金融嫁接,改变了传统保险和基金销售的格局。互联网金融最新的发展主要包括:第三方支付、移动支付与网络小额信贷等。从移动应用功能和用户资源竞争方面看,随着新的商业模式的创新和发展,以移动互联网为平台的移动应用越来越丰富,目前从类型上可以总体分为三类:公众服务、个人信息服务和
期刊
摘 要:文章对青岛大学附属医院生活服务公司在经营管理过程中立足“绿色、健康、阳光、环保、家园”的服务理念,坚持低成本、高效率、“零”利润的经营模式进行了分析。指出该公司在确保饭菜质量、稳定饭菜价格的前提下,为了缓解成本上涨的矛盾,公司加强内控管理措施,实施成本控制管理,对生产经营状况进行事前、事中、事后的分析与指导,取得了比较好的成绩。  关键词:成本控制 内控管理 竞争力  中图分类号:F234
期刊
摘 要:在当今知识经济时代,我国民营企业在市场经济大潮下迅速发展壮大,成为我国社会经济的重要组成部分,为社会主义现代化建设做出了积极贡献。但由于我国民营企业自身条件及外部环境等因素,导致大部分民营企业在财务管理中存在管理粗放、效益低下等诸多问题。因此从财务管理视角,阐明财务管理在我国民营企业经营管理中的重要作用,剖析民营企业在财务管理中存在的突出问题及其原因,提出“明确目标,拓宽渠道,提高能力,政
期刊
近年来,人们在强化学习领域的研究已经取得了令人瞩目的成就。然而在场景较为复杂时,传统的强化学习算法面临维度灾难以及长期信度分配问题,往往难以取得很好的效果,这限制了其实际应用。
  分层强化学习利用分而治之的思想,通过对复杂问题进行分层抽象,能够缓解传统强化学习算法中所存在的维度灾难以及长期信度分配问题,为建立大规模的强化学习系统带来了希望。
  然而在现有的分层强化学习算法中仍然普遍存在着以下问题:(1)由于层次强化学习中各层次策略彼此耦合,值函数估计中存在的过估计问题、算法中存在的采样低效
步态识别作为一种新兴的生物识别技术,具有广泛的应用场景与巨大的应用价值。步态识别利用行人行走数据确定行人身份,然而针对目前的数据集,步态识别任务仍然面临着诸多挑战,例如摄像头视角变化,路面状况、行人穿着、行走速度等,基于手工设计的步态特征在多个变量下的识别能力受到很大的局限。而随着深度学习的提出,其强大的图像处理与以任务为导向的学习能力为步态识别研究提供了新的选择。
  本文建立深度神经网络模型提取行人步态特征,并针对行走视频与轮廓图两种实验数据,设计了两种不同的建模方案,对应着两种步态识别方法。主
近年来,随着互联网的进一步发展,各种信息呈现爆炸式增长。特别是在大量的自媒体出现以后,在互联网新闻平台中每天都会出现大量重复的对相同新闻事件报道的新闻。这些大量重复的新闻极大地减弱了在互联网上进行信息传递以及信息检索的效率,因此需要对重复的新闻进行过滤并进行更准确的新闻推荐。目前,作为第四次工业革命核心的人工智能正在深刻地影响人们生活中的各个领域。这之中以机器学习为核心的自然语言处理技术又是人工智能领域的重要组成部分,而文本匹配作为自然语言处理的基础技术之一,旨在建立文本与文本之间的联系,从而能够有效地解
摘 要:在大力发展职业教育的今天,培养双师型教师队伍至关重要,是高职教育发展的必然要求。高职院校应注重双师型教师的培养,促进校企合作,促进教师与企业的交流,提高教师的教学能力、研发能力和社会服务能力。  关键词:教师专业发展 双师型教师 机电一体化专业  中图分类号:F240,G71  文献标识码:A  文章编号:1004-4914(2015)03-213-02  2012年6月11日,国务院新闻
期刊
摘 要:微型课题研究主要是高职高专一线教师对日常课堂教学中出现的具有普遍性、典型性的疑难问题进行深入细致的分析和研究。目的是让教师不断对课堂教学及时进行反思,从中获取有用的研究成果,运用在课堂教学中,提高课堂教学质量。  关键词:高职高专 微型课题 课堂教学  中途分类号: 文献标识码:A  文章编号:1004-4914(2015)03-246-02  高职高专微型课题研究是指教师对课堂教学中某些
期刊