论文部分内容阅读
随着互联网和宽带无线接入技术的发展,移动互联网应运而生,满足了人们随时随地享受互联网服务及相互交流的需求。在移动互联网产业链中,移动智能终端占据核心地位,成为人们生活中不可或缺的必需品,人们通过在移动终端上安装各式各样的移动应用软件,享受丰富的移动服务。在移动终端Android、iOS、WindowsPhone三大主流平台中,Android是占有用户最多的移动平台,被数以亿计的用户使用,Android应用更是以丰富多彩的服务内容和形式受到广大用户青睐。与此同时,以获取不正当赢利为目的的Android恶意应用层出不穷,带来了隐私泄露、恶意扣费、系统破坏等安全问题。本文主要采用机器学习的方法对Android恶意应用进行检测,针对Android应用样本的特征维度高、特征重要性不同、数据集不平衡等数据特征,主要研究基于联合特征、特征权重自适应计算、不平衡数据集过采样等技术的Android恶意应用检测方案,具体如下:(1)针对细粒度、高维的Android应用特征降低机器学习分类器效率问题,提出一种基于联合特征的Android恶意应用检测方案。首先,对Android应用样本反编译,提取细粒度的高维特征;然后,提出一种基于正则化和粒子群优化(PSO)算法结合的联合特征的挖掘方法,对高维特征之间关联关系包含的分类信息进行充分挖掘和利用;最后,采用机器学习分类器实现恶意应用检测。其中,针对粒子群优化算法设置粒子位置更新策略,提出一种基于二进制粒子群优化算法的指定长度的特征子集选择方法,从特征全集中选择指定长度的特征子集,降低特征的维度。实验结果表明联合特征的挖掘不仅能够降低特征维度,还能挖掘并利用特征关联关系隐含的分类信息,提高分类器的效率和性能;(2)针对数据集中各特征对于分类重要性不同的问题,提出一种基于特征权重自适应计算的Android恶意应用检测方案。首先,采用粒子群优化(PSO)算法计算特征权重;然后,使用特征权重对原始特征矩阵进行映射;最后,采用机器学习分类器实现恶意应用检测。其中,针对粒子群优化算法在计算特征权重的过程中易陷入局部最优的缺陷,提出一种基于适应度值更新和混沌变量的粒子群优化算法惯性权重调整方法(称为FCAIW-PSO),即在算法更新迭代过程中,根据适应度值更新的情况,再引入混沌变量,对粒子群优化算法的惯性权重进行调整,增强粒子搜索的多样性。实验结果表明,通过改进的粒子群优化算法计算的特征权重对原始特征矩阵进行映射,能够使同类型的样本分布更紧凑,不同类型的样本分布更松散,使得分类器更容易对样本空间进行划分,从而改善分类器的性能;(3)针对数据集不平衡、分类决策面偏向多类的问题,提出一种基于模糊集理论(Fuzzy Theory)和人工合成少类过采样技术(SMOTE)的过采样算法,称为Fuzzy-SMOTE。首先,基于模糊集理论计算少类样本的隶属度,定义模糊区域包含隶属度较小的少类样本;然后,结合模糊度为每个少类样本定义过采样率;接着,基于SMOTE方法人工合成少类新样本,改变原样本集的样本分布形态;最后,采用机器学习分类器实现恶意应用检测。实验结果表明,Fuzzy-SMOTE算法能有效破坏数据集的不平衡分布特性,进而影响分类面不再偏向多类,不仅提高了少类样本的分类性能,还提高了数据集(包含少类和多类)的整体分类性能。综上所述,本文研究的重点是根据Android应用样本集的数据特征,提出针对性的恶意应用检测方案。实验结果表明,本文所提的Android恶意应用检测方案和方法能够有效地提高检测性能,具有现实意义。