论文部分内容阅读
随着移动智能终端设备的飞速发展,人们的生活与工作离不开平板电脑与智能电话等移动设备的应用,信息安全问题已经不仅仅局限于PC机。因此,智能终端的操作系统安全成为了一个需要迫切解决的问题。近些年来,Android操作系统以其高开放性成为了应用最广泛的智能终端操作系统,它的安全性与安全机制不容忽视。当恶意软件入侵Android系统时该采取何种举措、是否可以对其进行有效检测等安全问题,是当今世界Android用户、应用开发商与终端制造商都急于求解的核心问题。本文针对Android平台的软件安全问题,设计了一个基于Android平台的恶意软件检测系统——ACS (Android-app Classification System)系统,该系统采用静态检测中的特征值检测方法,对样本集的分类检测过程进行了详细设计,针对分类结果对分类器和特征集的分类性能做出详细评估分析。系统从Android安装包文件与权限文件中提取出特征值源码,应用n-grams模型和信息增益理论对特征值源码进行选.择,最终形成待分类的六种特征集。系统使用机器学习算法中的六种分类器对这六种特征集分别进行分类处理,最终确定分类性能最好的特征集与分类器。论文的主要工作内容如下:1、ACS系统鉴别出AndroidManifest.xml特征集对表征恶意软件最具效果。系统对特征值源码文件进行n-grams模型提取后,计算n-grams的信息增益(Information Gain, IG),选取出IG值最高的前500个n-grams,组成了实验所需的六种特征集。这六种特征集分别为来源于Android权限文件的Full Permissions特征集和Permissions Tail特征集,来源于APK文件的classes.dex特征集、resouces.arsc特征集和AndroidManifest.xml特征集,并提出一个结合以上三者的新的特征集——Combined特征集。2、ACS系统鉴别出增强型决策树(Boosted Decision Trees, Boosted DT)和基于实例的学习(IBk)分类算法的分类效果比较显著。实验采取了六种机器学习算法对特征集进行分类,这六种分类器是:基于实例的学习者(instance based learner, IBk);朴素贝叶斯(Naive Bayes);决策树(Decision Trees);序列最小优化(SMO);增强型朴素贝叶斯(Boosted Naive Bayes, Boosted NB);增强型决策树(Boosted Decision Trees, Boosted DT)。3、ACS系统鉴别出使用增强型决策树(Boosted Decision Trees, Boosted DT)分类器对AndroidManifest.xml特征集进行分类时性能最好,平均精度达到99.24%,AUC值达到0.9890。实验通过36次不同的比较实验,采取六种特征集和六种分类器分别一一匹配的方式,运用ROC曲线属性和精度进行评估,对每一类特征集和分类器的分类性能都做了详细分析。