- 1、本文档共68页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
中文摘要
WebShell作为黑客常用的入侵工具,黑客利用WebShell获取服务器操作权限执
行命令,从而窃取用户数据。随着网络技术的发展,黑客为了提高WebShell逃避检
测的能力,对WebShell代码进行混淆加密,依赖危险函数识别的传统WebShell文本
检测方法对新型WebShell检测准确率低。另一方面,流量特征提取工具对WebShell
流量特征提取不充分,WebShell流量检测效果不佳。针对以上问题,本文的主要研
究工作如下:
(1)为了解决WebShell代码混淆导致文本检测准确率低的问题,提出一种基于
多特征融合的WebShell文本检测方法。该方法将WebShell的动态特征与静态特征相
融合作为WebShell文本检测的训练特征,动态特征为PHPWebShell的Opcode,对
Opcode使用N-gram和TF-IDF算法进行特征处理,静态特征为WebShell文件名或
者文件内容是否包含WebShell特殊关键词、最长语句占文本内容的比值、是否使用
编码函数对文本编码混淆、文本的信息熵、文本的压缩比、文本的重合指数。使用
XGBoost算法进行训练,通过实验验证了基于多特征融合的WebShell文本检测方法
对WebShell有着较好检测效果。
(2)为了解决流量特征提取工具特征提取不完善的问题,提出一种WebShell
流量特征提取方法,构建流量检测数据集。首先,搭建CMS平台收集用户正常访问
流量和WebShell攻击流量。然后,从流量中提取出HTTP报文。接下来,对冰蝎、
蚁剑和哥斯拉WebShell流量进行分析,总结出WebShell流量特征,对HTTP报文进
行特征提取。最后,构建WebShell流量检测数据集,使用机器学习算法在此数据集
上进行训练,通过实验证明了本文提出的流量特征提取方法可以更有效的检测出
WebShell流量。
(3)为了提高WebShell流量检测的准确率,提出一种基于Stacking模型融合的
WebShell流量检测方法。该方法使用GBDT算法、XGBoost算法和LightGBM算法
作为基学习器,将基学习器中检测效果最好的XGBoost算法作为元学习器,构建
GXL-Stacking模型。将GXL-Stacking模型在WebShell流量检测数据集上进行训练,
通过实验验证了基于Stacking模型融合的WebShell流量检测方法提升了流量检测效
果,可以更好的检测出WebShell流量。
(4)基于上述WebShell文本检测方法和流量检测方法设计并实现了WebShell
I
检测系统。系统检测模块包含文本检测模块、流量检测模块和综合检测模块,综合
检测模块根据用户上传的PHP文件和PCAP文件进行综合分析,结合文本检测结果
和流量检测结果判定是否为WebShell。系统将不同模块的检测结果展示给用户。
关键词:机器学习;WebShell检测;文本检测;流量检测
II
ABSTRACT
WebShell,asacommonlyusedhackingtool,isutilizedbyhackerstogain
operationalprivilegesandexecutecommandsonservers,therebystealinguserdata.With
theadvancementofnetworktechnology,hackershavebeenobfuscatingandencrypting
WebShellcodetoenhanceitsabilitytoevadedetection.TraditionalWebShelltext
detec
您可能关注的文档
- 基于FPGA的特种彩色摄像机驱动电路研制.pdf
- 基于GIS的山西省城区高中生体质健康状况的空间分布特征研究.pdf
- 基于LFM的雷达通信一体化波形设计与处理.pdf
- 基于LSTM和BP神经网络解决TDLAS谱线干扰的技术研究.pdf
- 基于MCMC方法的随机经济周期模型的参数估计.pdf
- 基于MIL-101的亲和材料对生物小分子特异性吸附的应用研究.pdf
- 基于MMVaR的投资组合模型优化.pdf
- 基于MXene_NH2-UiO-66_PtNPs的分子印迹电化学传感器用于检测食品中的己烯雌酚.pdf
- 基于NH分布的两类重要模型的可靠性分析.pdf
- 基于RUSLE的山西省土壤侵蚀时空格局与归因研究.pdf
文档评论(0)