- 20
- 0
- 约6.44千字
- 约 32页
- 2016-10-06 发布于湖北
- 举报
* * * * * * 关于恶意代码检测的想法 根据恶意代码API调用序列特征生成动作曲线,多个动作曲线重合概率较多的点筛选出,这些点称为可以动作点,将可疑动作点拟合为可疑动作曲线,根据可疑动作曲线的重合率判断恶意代码,利用贝叶斯算法测试。 1.典型恶意代码API调用序列 2.可疑动作曲线的优点在于相比于典型恶意代码API,减少API序列的随机性,进而减少漏判误判。 关于恶意代码检测的想法 Polymorphic(多态化)模糊流程 关于恶意代码检测的想法 提取恶意代码动态行为特征分析检测基本架构如左图所示。 第一步:搭建运行恶意代码的虚拟环境,便于加壳等一些处理过的恶意代码分析。 第二步:虚拟环境中执行恶意代码,并提取恶意代码动态行为语义特征。本课题选取恶意代码执行期间调用的API序列作为语义特征。 第三步:使用提取的语义特征进行模型建立,即组织语义信息建立语义模型。本课题对运行API调用序列加工,抽象为代表语义特征的动作曲线。 第四步:建立模型库,采用朴素贝叶斯进行检测。 注释:后期会考虑贝叶斯计算使用MapReduce进行并行计算优化,提升计算效率。 机器学习算法检测恶意代码 尝试编写一串指令来了解正常主机处理器和内存使用情况,然后同被感染主机上的处理器和内存使用情况进行比较。一旦发现这两组数据集中有一些不同的信息,就可以向计算机发送指令将这些信息应用到收集到从未知/未分类的系统收集的数据上。这样,让计算机来判断系统是否感染上恶意代码。 机器算法恶检测意代码的思路: cpu、内存使用情况检测恶意代码 实现方法 将记录的所有系统的内存和处理器的使用情况保存在一个execel文件中,host记录了主机名,proc和mem分别记录了cpu和内存的使用情况,而state记录了是否感染恶意代码,部分数据如图所示。 实现方法 按照上述算法的第一步,即分别计算被感染和正常系统中处理器和内存的平均使用情况。 R代码: inf - colMeans(train[train$state==Infected, c(proc, mem)]) nrm - colMeans(train[train$state==Normal, c(proc, mem)]) print(inf) ## proc mem ## 1.152025 1.201779 print(nrm) ## proc mem ## -0.8701412 -0.9386983 从注释中输出的均值容易发现,感染和未感染恶意代码的均值间差异较大,所以这个方法可以较好的实现算法。 实现方法 (1)定义和训练一个算法: a) 计算一直感染恶意软件系统的处理器和内存的平均使用情况。 b 计算已知正常的系统的处理器和内存平均使用情况。 (2)使用处理器和内存使用情况来预测未知系统是否感染恶意软件: a)如果处理器和内存使用情况更接近感染主机的平均情况,将该系统标记为已感染。 b)如果处理器和内存使用情况更接近正常主机的平均使用情况,将该系统标记为正常。 注释:一个分类器就是一组规则,或一个决策模型,它们是通过对一组训练数据进行学习而产生的。 实现方法 首先,加载数据并进行检查。将数据进行归一化处理后,这些数字保持在同一尺度内。为了进一步探索这些数据,可将这些数据描绘出来。给基于染而已代码的状态可以比较并区分处理器和内存数据,如图所示。 R代码: library(ggplot2) gg - ggplot(memproc, aes(proc, mem, color=state)) gg - gg + scale_color_brewer(palette=Set2) gg - gg + geom_point(size=3) + theme_bw() print(gg) 注意:归一化化定义:归一化化就是要把你需要处理的数据经过处理后(通过某种算法)限制在你需要的一定范围内。首先归一化是为了后面数据处理的方便,其次是保正程序运行时收敛加快。线性函数转换: y=(x-MinValue)/(MaxValue-MinValue) 实现方法 实现方法 第二步,对数据进行预测。从需要检测的数据中,选取其中的“proc”和“mem”值,然后计算这些值与刚才在算法训练过程中得到的均值距离有多远。在这里,我们采用了几何中的勾股定理:a2+b2=c2,公式中a和吧是三角的两条边,c是斜边。此处,a是训练和你测试得到的两个proc值的差,b是训练和测试得到的mem值的差。得到这两个距离后,仅作比较即可。 R代码: predict.malware - function(data) { proc - as.numeric(
您可能关注的文档
- 教科版科学六年级下册日食和月食分析.ppt
- 家乡的月儿明又圆重点.ppt
- 基于单片机的数字温度计的设计分析.doc
- 教科版科学六年级下册月相变化分析.ppt
- 家乡民风、民俗小谈论分析.ppt
- 基于单片机控制的数字气压计设计分析.doc
- 家用冰箱复习题重点.doc
- 教科版科学六下《太阳系》课件分析.ppt
- 家用电器辐射对我们日常生活的影响研究2010级13班陈晨小组研究性学习结题报告分析.doc
- 基于单片机控制的数字气压计设计与实现分析.doc
- 03-2 2025年度民主生活会征求意见座谈会主持词.docx
- 03-1 2025年度民主生活会主持讲话提纲.docx
- 02-1 会前学习-《县以上党和国家机关党员领导干部民主生活会若干规定》相关要求.docx
- 在2025年度民主生活会上的总结讲话三篇.docx
- 在2025年度民主生活会上的总结讲话三篇 (3).docx
- 市委宣传部2025年度民主生活会查摆问题整改方案两篇.docx
- 在市行政审批和政务信息管理局机关2026年全体干部政绩观教育大会上的党课讲稿.docx
- X市应急管理局2026年度安全生产监督检查计划.docx
- 2025年度民主生活会领导班子对照检查材料(五个带头)三篇.docx
- 2025年度民主生活会“五个带头”个人对照检查材料三篇.docx
最近下载
- 幼儿彩色描红:数字描红③.doc VIP
- T_HBYY 0066-2024 中药材机械化生产技术规程 柴胡—油菜间作.docx VIP
- 养育照护策略与行动--解读世界卫生组织《儿童早期发展养育照护框架》.docx VIP
- 2025年互联网营销师用户召回中的用户满意度(NPS)与净推荐值分析专题试卷及解析.pdf VIP
- 2025年素质测评考试题库及答案.doc VIP
- 山东省房屋建筑和市政工程施工图设计文件审查要点(2024年版) 第一册 房屋建筑.docx VIP
- 2024市场监管知识培训:价格法知识及价格执法典型案例培训课件.pptx
- T_HBYY 0068-2024 中药材机械化生产技术规程 半夏.docx VIP
- 小学三年级数学除法竖式计算题及答案(300道题).pdf VIP
- 日产300吨环形双膛石灰竖窑方案.doc
原创力文档

文档评论(0)