基于汇编指令上下文的变量类型推断

来源 :南京大学 | 被引量 : 0次 | 上传用户:king20051400
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
程序分析技术是一种有效消除代码缺陷的技术。二进制程序文件中的变量信息,可以辅助代码分析工具理解程序的功能与逻辑。但是在闭源软件中,这些信息均被抹除。目前有很多恢复变量信息的工作,它们都依据事先制定的规则,提取变量操作指令及其中的数据依赖关系作为特征,从而恢复变量信息。这些工作普遍遇到了两个问题。首先,随着编译器及系统的发展,这些工作中已有的规则需要被升级。其次,对于一些参与少量的运算的孤立变量,现有工作难以获得足够的有效特征。这会导致一些变量的特征之间存在歧义,即不同类型的变量可能被收集到同样的特征。针对孤立变量特征欠缺的问题,本工作发现变量操作指令的近邻操作指令,有大概率操作同类型变量,因此将其引入作为变量操作上下文,使变量特征更加丰富且减少了特征之间的歧义;针对规则需要升级的问题,我们使用预训练词向量和神经网络,自动化捕捉不同体系结构汇编代码中蕴含的语义并推断其中的变量类型信息,避免了大量的人工劳动。我们由此开发了一个跨体系结构的变量类型推断工具。相较之前工作,它在常见体系结构上的正确率都有较大的提升。在目前使用最广泛的x86_64上,使用相同分类标准,正确率由原有的73%提升至86%。论文的研究工作和贡献点包括:(1)我们对一万六千余个二进制程序文件进行了实证性研究,在不同的编译条件下,分析了孤立变量的数据依赖缺失的问题,给出了传统的基于数据依赖的类型推断系统的局限性及分析理论上限;(2)我们通过调研发现,目标变量操作指令的近邻指令有大概率操作同类型变量,因此将其作为上下文进行共同编码,作为目标变量的特征。接着,我们以此为基础,构建了一种新型的智能化类型推断工具;(3)我们在不同体系结构、不同编译器、不同优化等级下测试了本工具的有效性及可迁移性,并与当前最新的工作进行比较,展现了优越性。
其他文献
目的研究肽基精氨酸脱亚胺酶4(Peptidyl arginine deaminase 4,PAD4)的小干扰RNA(small interfering RNA,siRNA)载体对胶原诱导关节炎(collagen-induced arthritis,CIA)小鼠的治疗作用及其机制。方法采用牛Ⅱ型胶原建立CIA模型,实验分为空白组(DBA/Ⅰ小鼠不做任何处理)、模型组(建立CIA小鼠后没有进行其他处理
研究背景雷公藤内脂醇(TP)是一种从传统中草药雷公藤中提取的环氧二萜内酯化合物,具有较强的抗肿瘤、免疫抑制和抗炎作用,但由于其溶解度较低和毒性限制了其在临床中的应用。长期使用可导致肝肿大、肝损伤、ALT、AST升高等不良事件。因此TP的结构修饰与开发新的TP靶向给药系统十分必要。TP衍生物的涌现加深了人们对于TP各个基团功能及其参与信号通路的理解。TP发挥抗肿瘤作用有多种方式:诱导肿瘤的凋亡与自噬
近些年来随着计算机辅助技术的进步,自由曲面建筑得到了蓬勃的发展,非线性的形态成为当下的一种趋势。尽管建筑师可以借助建模软件便捷地得到自由曲面形态,但是在建筑的实际建造过程面临着许多挑战,其中一个重要的问题为曲面优化问题,即如何找到一个适合建造的曲面来近似拟合一个理想曲面,这通常意味着对曲面进行平板化重构。目前大多数实践与研究都是采用单一多边形网格来拟合曲面,但此种使用相同类型的多边形平板来满铺曲面
癌症的早期筛查和诊断是提高癌症患者治愈率和日常生活品质,甚至能够延长生命的重要手段之一。目前的癌症诊断金标准——组织活检无法提供早期的病理信息,侵入性的取样方式易对患者造成二次伤害,且检测成本高、时间久。近年来新兴的液体活检技术为癌症的早期诊断提供了更多可能。液体活检具备取样方便、来源广泛、操作简单、及时迅速等优点。循环肿瘤细胞以及外泌体是当前液体活检的主要对象,而且已展现出了巨大的临床应用潜力。
我国汽车保有量正随着经济的不断发展呈现快速增长的态势,日渐拥堵的地上空间以及大量停车位的缺口使得地下车库成为城市建设的必备设施。但由于地下车库长期处于封闭状态,基本与室外自然空气和阳光隔绝,使得污染情况严重,甚至影响人体的健康。地下车库的主要污染物中CO成分远高于其他污染物,对人体的伤害也最大。因此,想要改善地下车库的空气质量,就必须寻找合适的通风方案将CO浓度限制在规定范围内。本文采用现场检测与
渐晕是拍摄图片时的一种不良反应,具体表现为远离图像中心,亮度径向衰减,在暗光拍摄等场景下尤为明显。针对夜光成像课题组所遇到的视频渐晕问题,本文深入分析了学术界现有的几种渐晕校正算法,其中针对非预定相机,单张图像的渐晕校正算法更适合项目应用场景。但由于算法复杂度较高,在嵌入式平台上运行无法满足视频的吞吐率需求,因此本文设计了图像渐晕校正算法的硬件加速器。本文重点介绍了基于对数强度熵最小化的渐晕校正算
图像超分辨率定义为放大图像的空间分辨率,是经典的底层视觉问题之一。图像超分辨率在公共安全、医疗、遥感、移动互联等领域具有广泛的实际应用需求。随着智能化时代的到来,图像数据已经成为获取信息的重要渠道,数以亿计的图像数据在不同设备中和不同场景下产生。由于受到低像素相机、压缩存储、高放大倍数等因素影响,大量图像存在低分辨率、模糊、噪声多等现象。如何将不同场景下低分辨率照片的画质进行增强,还原自然图像丰富
目的 探究康复训练延伸指导路径对烧伤患者肌力、步行功能和手功能的影响,以期为烧伤患者早期康复提供参考。方法 选取收治于宁夏医科大学总医院烧伤科的患者作为研究对象。以2019年6-12月收治的25例患者作为对照组,给予常规康复治疗和护理;以2020年5-10月收治的25例患者作为观察组,在对照组基础上实施康复训练延伸指导路径。采用肌力分级、Holden步行功能分类和Michigan手功能问卷,于干预
目的氧化钕是一类新型的稀土氧化物材料,被广泛应用于多个领域。随着纳米技术的发展与应用,暴露于纳米氧化钕的职业人群也越来越多,其对健康潜在的威胁也受到了人们的关注。目前关于纳米氧化钕的研究较为匮乏,且其毒性机制也并未完全被阐释。基于这样的背景,本研究重点探讨了纳米氧化钕对早期发育的影响,并通过多种生物学手段揭示其可能的毒性机制,希望为职业卫生暴露者提供可靠的实践指导。方法本研究使用不同浓度纳米氧化钕
化学气体传感器件,作为一种将化学信息转化为数字信息的设备,与人们的日常生活和生命健康息息相关。其中,化学电阻式(chemiresistor)气体传感器,与当前广泛使用的电化学式传感器,光学式化学传感器等相比,具有低功耗、低成本、易于与标准电子设备集成等优点。常用的化学电阻传感材料包括导电聚合物,陶瓷,金属氧化物半导体,碳基纳米材料等。这些材料各有特点,但很少能同时满足低功耗、低成本、高选择性、高稳