玩转攻击检测用机器学习-HITCON.PDFVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
玩转攻击检测用机器学习-HITCON

⽤机器学习 玩转攻击检测 ID: tang3 绿盟科技 申军利 WHOAMI • ID :tang3 • 绿盟科技安全研究员 • WEB——Java Web相关、 PHP代码审计、渗透攻防技术 研究 • 机器学习围观⼈员 • 健⾝爱好研究者 • 棋臭瘾⼤围棋渣 ⺫的:思路分享 思路、⼼得、实践 常⻅机器学习⽅向 • 预测 • 分类 • 聚类 机器学习是 将现实问题转换为数学问题求解的过程 思考步骤 • 确认待解决问题是哪⼀类的问题 • 先正则后机器学习(量→质) 没⾜够数量级的样本说个P 思考步骤 • 确认待解决问题是哪⼀类的问题分类 • 先正则后机器学习(量→质) • 特征量如何数字化(数据预处理) 数据的预处理—— 将数据内容转化为可以计算的模样 思考步骤 • 确认待解决问题是哪⼀类的问题分类 • 先正则后机器学习(量→质) • 特征量如何数字化(数据预处理) • 选择最适合的算法 • 初期效果不错后再对算法进⾏进⼀步完善 机器学习不是万灵药,它也有适合不适合的场景 实战环节 攻击检测引擎的实现 问题思考 • 正常与攻击的⼆分类问题(逻辑回归?) • 攻击语句按照类型可以很容易得到⼤量样本 • 特征量是什么?怎么数字化? -1 and union select password from admin —+ 垃圾邮件分类器 朴素⻉叶斯算法 (Naive Bayes , NB 算法) 问题思考 • 正常与攻击的⼆分类问题(逻辑回归?) • 攻击语句按照类型可以很容易得到⼤量样本 • 特征量是什么?怎么数字化? 统计! 词与词的 关系 问题思考 • 正常与攻击的⼆分类问题(逻辑回归?) • 攻击语句按照类型可以很容易得到⼤量样本 • 特征量是什么?怎么数字化? • 算法:朴素⻉叶斯 公式推演 • D为整个⽂本,h+/h-分别代表攻击和⾮攻击,W1 代表D中的第⼀个单词 • P(h+|D) = P(h+)*P(D|h+)/P(D) • P(h-|D) = P(h-)*P(D|h-)/P(D) • P(h+|D)P(h-|D) • 使⽤朴素⻉叶斯来简化计算 P(D|h+)=P(W1|h+)*P(W2|h+)*P(W3|h+)… 
 P(D|h-)=P(W1|h-)*P(W2|h-)*P(W3|h-)… 公式实际应⽤ • -1 union select 1,123,2 —+ • p(-1 union select 1,123,2 --+|h+) = p(-1|h+) · p(union|h+) · p(select|h+) · p(1|h+) · … 使⽤统计 • ⼤数定理 • 1000个攻击相关的单词,union出现了10次,

文档评论(0)

2105194781 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档