基于机器学习的批量网页篡改检测方法研究.pptVIP

  • 39
  • 0
  • 约1.51千字
  • 约 12页
  • 2017-02-28 发布于江苏
  • 举报

基于机器学习的批量网页篡改检测方法研究.ppt

基于机器学习的批量网页 篡改检测方法研究 目录 Contents 一、研究背景 二、网页篡改检测方法 三、性能分析及优化 四、总结 近年来,随着互联网的普及,网站已成为政府、学校、企业等组织机构信息发布和传播的重要途径,网站安全成为网络安全的重要领域。 CNCERT监测发现,2015年我国境内近2.5万个网站被篡改 高效、准确、具有良好扩展性的网页篡改检测方法是应对网页篡改问题的有效途径。 以北京大学所有注册网站为研究对象,通过抓取网站首页面的所有历史信息,对抓取数据进行分类建立对应的检测规则,综合判断网页是否存在篡改。 一、研究背景 二、网页篡改检测方法 二、网页篡改检测方法 检测器设计;两个重要的参数:检测数据集窗口大小;判别器阈值 二、网页篡改检测方法 检测器 检测特征 是否需要训练 树形结构检测器 树结构、节点种类 是 文本聚类检测器 正文文本 是 特征数量检测器 代码行数、链接数量 图片数量、文件大小 是 JC检测器 JS、CSS文件相似度 否 图片检测器 相似度、关键字识别 否 篡改特征检测器 含有

文档评论(0)

1亿VIP精品文档

相关文档