- 1、本文档共66页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
摘要
基于机器学习的Android恶意软件检测方法具备自动化程度高、检测速度快等优势,目
前已有很多检测模型使用机器学习方法构建。然而,这些检测模型存在检测准确率有待提高
和模型鲁棒性欠缺的问题。检测准确率有待提高的主要原因是用于训练的特征向量的表征能
力偏弱,检测模型在面对不同类别相似度较高的样本时,会产生较多的漏报和误报。检测模
型鲁棒性欠缺的原因是模型训练仅使用有限的样本进行拟合,脱离样本分布空间的样本容易
混淆模型,并且检测模型容易受到对抗样本攻击的影响,进而模型的检测结果受到干扰。
针对传统机器学习方法检测Android恶意软件准确率偏低的问题,本文提出基于特征图
像生成的Android恶意软件检测方法(FIG-AMD方法)。FIG-AMD方法提取APK文件的权
限、API和操作码作为特征,并使用改进的FPGrowth算法对特征进行挖掘;再使用降噪自编
码器对特征信息进行抽取和转换维度,拼接并生成RGB特征图像用于训练和分类;最后构建
BaggingCNN分类算法,该算法基于集成算法思想将多种卷积神经网络进行集成,利用投票机
制进行分类。实验结果表明,FIG-AMD方法可以准确区分良性软件和恶意软件,检测准确率
达到98.21%。
对抗样本可以用来测试检测模型的鲁棒性,为完善模型提供思路。然而,现有Android对
抗样本生成方法在控制生成成本和提高有效性方面存在不足,针对于此,本文提出基于特征
贡献度的Android对抗样本生成方法(CD-ASG方法)。CD-ASG方法从特征出现频率、特征
与对应类别关联程度两个角度定义并计算特征对于生成对抗样本的贡献度;基于黑盒攻击的
思想,在不对原始应用程序产生破坏的前提下,根据贡献度大小决定修改特征的优先级,并
动态生成对抗样本。实验结果表明,多种Android恶意软件机器学习模型在检测CD-ASG方
法生成的对抗样本时,准确率都会有较大幅度的降低,平均降低幅度达到78.04%。
利用机器学习方法构建的Android恶意软件检测模型存在鲁棒性欠缺的问题。针对于此,
本文提出基于混合模型的Android恶意软件检测模型鲁棒性增强方法(H-Model方法)。H-
Model方法包括前置模型和动态模型两部分,两部分协同过滤对抗样本,以达到提升模型鲁
棒性的目的;H-Model方法通过在原始检测模型之前安插前置模型,以及将原始检测模型对
抗训练成动态模型,以此将原始检测模型构建成具备高鲁棒性的混合模型。实验结果表明,
H-Model方法具备良好的通用性,可以有效提高多种原始检测模型的鲁棒性,并且保持模型
的原始检测性能。
关键词:机器学习;Android恶意软件;深度学习;对抗样本;模型鲁棒性
Abstract
Androidmalwaredetectionmethodbasedonmachinelearninghastheadvantagesofhigh
automationandfastdetectionspeed.Manydetectionmodelshavebeenbuiltusingmachinelearning
methods.However,thesedetectionmodelshaveproblemsthatthedetectionaccuracyneedstobe
improvedandtherobustnessofthesemodelsisinsufficient.Themainreasonwhythedetection
accuracyneedstobeimprovedisthattherepresentationabilityofthefeaturevectorsusedfortraining
isweak.Thedetectionmodelsgeneratemoremissesandfalsepositiveswhenfacingsampleswith
highsimilarityindifferentcatego
您可能关注的文档
- 基于DeepSort的斑马鱼轨迹追踪研究与应用.pdf
- 基于Diffusion的集群多任务分配与聚类算法研究.pdf
- 基于Docker的云数据库服务设计与实现.pdf
- 基于ESG因子和Smart Beta策略的选股决策研究.pdf
- 基于EVA的PL房地产公司财务绩效评价研究.pdf
- 基于fsQCA的区域品牌价值提升路径研究.pdf
- 基于GBD2019数据库分析1990—2019年全球COPD疾病负担及其归因危险因素的时空趋势.pdf
- 基于GPU的声纳图像去噪方法研究.pdf
- 基于GPU深度网络的加速算法研究.pdf
- 基于JAVA的电力调度监控管理系统的设计与实现.pdf
- 中国普通硅酸盐水泥项目创业投资方案.docx
- 中国普通马桶盖项目创业投资方案.docx
- 中国普通刨花板项目创业投资方案.docx
- 中国七彩夹层玻璃项目创业投资方案.docx
- 四川省洪雅青衣江元明粉有限公司行业竞争力评级分析报告(2023版).pdf
- 苏教版高中化学选择性必修3有机化学基础精品课件 专题5 药物合成的重要原料——卤代烃、胺、酰胺 第一单元 卤代烃-微专题7 卤代烃的形成及其在有机合成中的“桥梁”作用.ppt
- 中国嵌入式衣柜项目创业投资方案.docx
- 中国平流式沉淀池项目创业投资方案.docx
- 中国七彩夹层玻璃市场竞争态势及投资规划建议报告项目创业投资方案.docx
- 中国嵌入式红酒柜项目创业投资方案.docx
最近下载
- 人教版英语2025七年级下册Unit5 Here and Now(教师版)语法讲解+练习.docx
- 2010-2023历年大连市七年级(下)数学月考卷.docx VIP
- 2025年形势与政策题库 (2).docx
- 2010-2023历年大连市七年级(下)数学月考卷.docx VIP
- 2023年共青团基础知识考试题库400题(含答案).pdf VIP
- 2025年湖南省师大附中招生全国统一考试考试(模拟卷)语文试题含解析.doc VIP
- 湖南省长沙市宁乡市2025届招生全国统一考试最新模拟卷语文试题(一)含解析.doc VIP
- 2024届湖南省宁乡一中招生全国统一考试语文试题冲刺试卷(一)含解析.doc VIP
- 1.1 思维的含义与特征 课件-高中政治统编版选择性必修三逻辑与思维.pptx
- 精益物流培训课件.ppt VIP
文档评论(0)