网站大量收购独家精品文档,联系QQ:2885784924

Android恶意软件检测方法及其鲁棒性研究.pdfVIP

Android恶意软件检测方法及其鲁棒性研究.pdf

  1. 1、本文档共66页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

摘要

基于机器学习的Android恶意软件检测方法具备自动化程度高、检测速度快等优势,目

前已有很多检测模型使用机器学习方法构建。然而,这些检测模型存在检测准确率有待提高

和模型鲁棒性欠缺的问题。检测准确率有待提高的主要原因是用于训练的特征向量的表征能

力偏弱,检测模型在面对不同类别相似度较高的样本时,会产生较多的漏报和误报。检测模

型鲁棒性欠缺的原因是模型训练仅使用有限的样本进行拟合,脱离样本分布空间的样本容易

混淆模型,并且检测模型容易受到对抗样本攻击的影响,进而模型的检测结果受到干扰。

针对传统机器学习方法检测Android恶意软件准确率偏低的问题,本文提出基于特征图

像生成的Android恶意软件检测方法(FIG-AMD方法)。FIG-AMD方法提取APK文件的权

限、API和操作码作为特征,并使用改进的FPGrowth算法对特征进行挖掘;再使用降噪自编

码器对特征信息进行抽取和转换维度,拼接并生成RGB特征图像用于训练和分类;最后构建

BaggingCNN分类算法,该算法基于集成算法思想将多种卷积神经网络进行集成,利用投票机

制进行分类。实验结果表明,FIG-AMD方法可以准确区分良性软件和恶意软件,检测准确率

达到98.21%。

对抗样本可以用来测试检测模型的鲁棒性,为完善模型提供思路。然而,现有Android对

抗样本生成方法在控制生成成本和提高有效性方面存在不足,针对于此,本文提出基于特征

贡献度的Android对抗样本生成方法(CD-ASG方法)。CD-ASG方法从特征出现频率、特征

与对应类别关联程度两个角度定义并计算特征对于生成对抗样本的贡献度;基于黑盒攻击的

思想,在不对原始应用程序产生破坏的前提下,根据贡献度大小决定修改特征的优先级,并

动态生成对抗样本。实验结果表明,多种Android恶意软件机器学习模型在检测CD-ASG方

法生成的对抗样本时,准确率都会有较大幅度的降低,平均降低幅度达到78.04%。

利用机器学习方法构建的Android恶意软件检测模型存在鲁棒性欠缺的问题。针对于此,

本文提出基于混合模型的Android恶意软件检测模型鲁棒性增强方法(H-Model方法)。H-

Model方法包括前置模型和动态模型两部分,两部分协同过滤对抗样本,以达到提升模型鲁

棒性的目的;H-Model方法通过在原始检测模型之前安插前置模型,以及将原始检测模型对

抗训练成动态模型,以此将原始检测模型构建成具备高鲁棒性的混合模型。实验结果表明,

H-Model方法具备良好的通用性,可以有效提高多种原始检测模型的鲁棒性,并且保持模型

的原始检测性能。

关键词:机器学习;Android恶意软件;深度学习;对抗样本;模型鲁棒性

Abstract

Androidmalwaredetectionmethodbasedonmachinelearninghastheadvantagesofhigh

automationandfastdetectionspeed.Manydetectionmodelshavebeenbuiltusingmachinelearning

methods.However,thesedetectionmodelshaveproblemsthatthedetectionaccuracyneedstobe

improvedandtherobustnessofthesemodelsisinsufficient.Themainreasonwhythedetection

accuracyneedstobeimprovedisthattherepresentationabilityofthefeaturevectorsusedfortraining

isweak.Thedetectionmodelsgeneratemoremissesandfalsepositiveswhenfacingsampleswith

highsimilarityindifferentcatego

文档评论(0)

论文资源 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档