一种基于TSVM的phishing网页检测方法的中期报告.docx

下载文档

1
0
约小于1千字
约 2页
2023-08-26 发布于上海
举报
版权申诉
保障服务

一种基于TSVM的phishing网页检测方法的中期报告.docx

1、本文档共2页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

一种基于TSVM的phishing网页检测方法的中期报告一、研究背景随着互联网技术的飞速发展，互联网恶意攻击也越来越猖獗。其中，网络钓鱼（phishing）攻击是一种常见的网络安全威胁，它通过伪造合法网站的方式骗取用户的账户和密码，甚至财产。因此，对于phishing网页的检测变得越来越重要。目前，传统的机器学习方法和深度学习方法被广泛应用于phishing网页的检测。二、研究目的本文的主要研究目的是提出一种基于两阶段支持向量机算法（TSVM）的phishing网页检测方法，结合传统特征和顶点相似度特征，提高钓鱼网站的检测精度。三、研究方法 1. 数据集准备：利用实际互联网数据搜集phishing网页的URL，并与合法网站的URL组成数据集，通过网络爬虫获取页面信息。 2. 特征提取：提取页面文本、链接、图像和meta标签等传统特征，并使用PageRank算法提取网页的顶点相似度特征。 3. TSVM模型训练：首先使用k-means算法聚类，将数据集分为两部分：常规网站和phishing网站。然后，构建两个SVM模型，一个用于常规网站分类，另一个用于phishing网站分类。最后，将两个模型合并为一个TSVM模型。 4. 模型测试：使用5折交叉验证方法测试模型的准确性、召回率、F1值和AUC值等指标，并与其他基于机器学习和深度学习的phishing网页检测方法进行比较。四、研究进展与预期结果目前，我们已完成了数据集的准备、特征提取和TSVM模型的训练。下一步将进行模型测试和结果分析。我们希望在实验中获得一个准确性90%的检测模型，并在精度、召回率、F1和AUC等指标方面优于其他传统机器学习和深度学习方法，使得我们的模型能够在实际应用中发挥更好的效果。

您可能关注的文档

文档评论（0）

kuailelaifenxian + 关注: 官方认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

认证主体太仓市沙溪镇牛文库商务信息咨询服务部

IP属地上海

统一社会信用代码/组织机构代码: 92320585MA1WRHUU8N

1亿VIP精品文档

更多 >

一种基于TSVM的phishing网页检测方法的中期报告.docx