- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机病毒检测技术研究进展 (基于多重朴素贝叶斯算法的未知病毒检测);当前的计算机病毒检测技术主要基于特征检测法,基本方法是提取已知病毒样本的特征,将其添加到病毒特征库中,在病毒检测时通过搜索病毒特征库查找是否存在相匹配的病毒特征来发现病毒。
这种方法只能用于监测已知的病毒,而对新病毒的检测就无能为力了。;基于多重朴素贝叶斯分类算法的检测方法可以实现对计算机病毒的近似判别。
采用多重朴素贝叶斯分类算法对提取的可疑文件行为特征进行分析,并利用病毒程序与正常程序的行为特征的差异性进行分类,从而达到检测未知病毒的目的。;贝叶斯推理提供推理的一种概率手段,这对于病毒的近似判定十分合适。其基石是贝叶斯公式:;分类器在给定描述实例的属性值下计算最可能的目标值Vmap:;朴素贝叶斯分类器基于一个简单的假定:在给定目标值时属性值之间相互条件独立,故有:;因为上述方法的计算开销很大,我们使用多个贝叶斯分类器,对样本的特征向量分成多个子集分别计算,然后用一个多重贝叶斯算法对多个朴素贝叶斯分类器获得的结果进行综合求值:;经过上述修正后,计算待测样本x类别VMNB的公式为:;病毒代码在计算机系统运行过程中非法获得控制权,其本质是复制和非授权的程序加载。
病毒程序与一般程序的区别在于执行了一些特殊的动作来破坏系统。(病毒可以看成是一种程序)它需要调用操作系统提供的各种功能函数才能达到传播自身和破坏系统的目的。
因此,通过监视程序所调用的API函数来实现对程序的行为监控是一种有效的方法。;所作的假设:
1.计算机病毒程序运行时通过API函数与操作系统交互。
2.染毒程序运行时,其传染模块均会运行,而破坏模块不一定会运行。
3.可执行程序的系统调用序列在运行时可以被有效地监控。;这里我们主要检测程序调用的API函数,采用统计学中的均方差来体现不同API函数调用的“贡献程度”。
1.对所用训练库的样本进行系统调用统计,获得调用的API序列A={A1,A2,...,Ai},统计每个API在每一病毒程序Vj中出现的概率AijV及在每一正常程序Nj中出现的概率AijN。
2.计算每个API函数在病???程序中出现的概率均值:
计算每个API函数在正常程序中出现的概率均值:;3.计算每个API函数的总出现频率均值:
4.计算每个API函数的类间频率均方差:
;计算机病毒检测是一个二值分类过程,即病毒与非病毒两类。
对于样本空间中的每一个样本程序x,均可以从中提取出感兴趣的一组特征集F,定义C为分类集,即{正常,病毒},令C1表示正常,C2表示病毒,它是一个随机变量。
我们的目标是:在获得给定样本程序文件中的特征集F后,判别出该样本是正常程序或病毒程序的概率,即计算出P(C|F):;因为特征向量F中又包含有分量F1,F2,...,Fn,所以上式可以写成:;上式方法的计算量很大,为改善性能,根据特征量的“危险度”不同,将所有的特征量分成n类,对每一类分别使用一个朴素贝叶斯分类器进行分类,最后用一个多重贝叶斯算法将n个分类器计算所得的待测样本所属类别的概率综合求值,作为样本程序分类的最终依据:;经过上述修正,计算待测样本x类别Cx的公式为:;与其他的数据挖掘算法一样,贝叶斯分类器也需产生规则集以预测新的实例类别。
朴素贝叶斯发现的分类规则是基于统计方法得到的。
当新的实例加入样本空间后,就可进入新一轮的学习,更新分类,如此往复。;(1)训练算法
input : 训练样本集
Output : 分类规则classification rules
Procedure :
1)对训练集合中全部样本的特征进行提取
2)统计各特征量出现的频率
3)return classification rules;(2)分类算法
input : 一个要分类的查询实例xq
Output : 类别C
Procedure :
1)提取出特征向量
2)计算:
3)return Cx,式中Cx∈{正常程序,病毒程序};(3)自学习算法
input : 训练集L,测试集T
Output : 分类规则
Procedure :
while(T!=Φ){
for each xj∈T{
call 分类算法,对xj分类,并将其加入到样本空间的相应集合
call 训练算法,更新分类规则}
return classification rules};
您可能关注的文档
最近下载
- 企业内部控制采购业务.doc VIP
- 2022年深圳市大鹏新区招聘社区专职工作者考试真题.docx VIP
- 数字化转型背景下职业教育信息化建设路径.pptx VIP
- 第8课 用制度体系保证人民当家作主【2023年秋最新版】.pptx VIP
- 比泽尔-半封闭整体型螺杆压缩机-中文操作手册CSH65-CSH75-CSH85-CSH95.pdf VIP
- 《无衣》(教学课件)-2024-2025学年高二语文选择性必修上册同步备课系列(统编版2019).pptx
- 基于特征性肽段检测人血浆中特瑞普利单抗药物浓度的液相色谱串联质谱方法.pdf VIP
- 矿业权评估师经济与法律笔记2023.docx VIP
- 肺部感染合并心衰护理查房.pptx VIP
- 财富管理02基础-家庭财务报表.ppt VIP
文档评论(0)