基于陷阱的spider检测评价模型研究-计算机应用技术专业论文.docxVIP

基于陷阱的spider检测评价模型研究-计算机应用技术专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
沈阳航空航天大学硕士学位论文摘要 沈阳航空航天大学硕士学位论文 摘要 Spider(网络爬虫)是一种网络资源获取程序,它加速网络流通的同时也增加了网络 负载,有必要监控spider对网站的访问。目前,spider检测技术主要基于决策树,贝叶 斯网络等方法,针对这些检测技术的评价主要依靠人工分析web曰志数据,计算其召回 率和准确率。为避免人工分析带来的主观性,寻求一种新的有效的评价方法具有重要的 意义。 本文介绍了spider的特点以及常见spider检测技术,详细分析了现有检测技术评价 方法的优缺点。针对传统评价方法中存在的一些问题,提出一种基于陷阱技术的spider 检测评价方法,该方法利用陷阱在网站的布置情况和用户的访问过程信息,结合概率论 中的二项分布理论,给出了相关参数和指标的计算方法。 基于陷阱的评价模型不依赖于人工分析,具有很强的准确性,充分利用了陷阱特性, 巧妙的结合用户访问过程信息和二项分布理论,对现有的spider检测技术进行了多角度 的评价。同时也分析了不同时间阈值和不同陷阱布置率对评价结果的影响。 实验表明该评价方法与人工评价具有一致性,较基于人工分析的评价方法具有很大 的优势,具有准确性和客观性,也是一种很简便的自动评价方法。陷阱评价虽然在一定 程度上受时间阈值地干扰,但是如果这种变化控制在10%以内,陷阱评价结果将变得可 靠与可信。 关键词:陷阱;spider检测;准确率;召回率 沈阳航空航天大学硕士学位论文Abstract 沈阳航空航天大学硕士学位论文 Abstract Spider(Web robot)is a program for harvesting intemet resources,which not only speeds up the flow but also accelerates the load of the network,SO it is necessary to regulate and monitor behaviors of spiders visiting website.Currently,the evaluation of these detection techniques mainly relies on manual analysis of web log data to calculate the recall rate and accuracy.In order to avoid the subj ectivity of manual analysis,to find a new effective method is of great significance. The features of spiders and the common spider detection techniques are described in this paper.The advantages and disadvantages of existing evaluation methods of which are analyzed in detail.According to the fault of traditional evaluation methods,a novel evaluation method of spider detection techniques based on trap and combined with the binomial probability theory are proposed,which puts forward the calculation method of relevant parameters and indicators by utilizing the layout of trap Links and the process information of users’access to the website. The evaluation model based on the trap with strong accuracy does not rely on manual analysis,which makes full use of the trap features and skillfully combines the information of user access to website and the binomial theory,and it can evaluate the existing spider detection techniques from various

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档