- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
网络安全技术
一、内容安全技术概述
互联网破坏行为增加了互联网用户进行业务活动的风险,也降低了互联网信息服务的
管理水平和服务质量。
要阻止这些网络破坏行为,营造良好的网络活动氛围,就需要建立一套功能完善、性
能较好且易于维护和扩展的移动互联网信息容安全技术体系。
通过可靠的检测技术保护信息容安全,这种技术被称为互联网信息容安全技术。
二、内容采集、过滤、审计技术
用户要实现互联网信息容安全,就必须依靠先进的技术体系来保障。目前,整个技
术流程可以分为对信息的采集、过滤和容审计3个步骤。
1、容采集技术
数据采集主要是指从本地数据库、互联网、物联网等数据源导入数据,包括数据的提
取、转换和加载。由于数据源不一样,数据采集的技术体系也不尽相同。
互联网容采集主要采用的技术包括容协商、身份认证、Web信息采集和搜索引
擎等。
(1)容协商机制
由于客户端设备性能以及用户喜好的不同,对同一个网络对象质量及形式的要求也会
有所不同。
因此,在网络中,一个网络对象可能会有多种不同的表现形式,比如,同一个网络资
源会有不同的媒体类型的版本,也可能有不同语言的版本等。
在向Web服务器发送请求的时候,用户将其对网络资源的要求包含在请求中,Web
服务器在接收到这样的请求后,会根据自身的情况对请求做出适当响应。
双方在确定了请求资源的版本后再进行资源的获取。这种客户端和服务器之间通过协
商的方式来获得容的过程被称为容协商,容协商机制已经得到了HTTP的支持。
(2)基于Cookie的身份认证
Web服务主要通过HTTP来实现浏览器和服务器之间的信息交互,由于HTTP是一
种无状态协议,它并不能在同一用户不同时刻访问相同Web网站时进行用户信息的记忆
与继承,即HTTP协议无法对各个不同的用户进行区分,Cookie就是为了弥补HTTP这
一缺陷而诞生的。
利用Cookie实现身份认证是在传统Cookie机制的基础上,Web服务器使用自行定
义的认证方式,向通过认证的客户端传递一个代表客户端身份的Cookie信息。
若客户端后续发送的请求中包含此Cookie,服务器就通过这个Cookie来识别特定
的客户端,返回客户端请求的页面。
若客户端后续发送的请求中不包含Cookie,或者包含了一个服务器无法识别的
Cookie,则服务器认为这是一个新用户的请求,如果用户请求的是一个需要用户认证后
才可以访问的页面,则服务器会返回一个认证失败的页面,并要求用户进行身份认证。
(3)Web信息采集技术
Web信息采集技术通过分析网页的HTML代码,获取网的超级链接信息,使用广
度优先搜索算法和增量存储算法,实现自动地连续分析链接、抓取文件、处理和保存数据
的过程。
系统在再次运行中通过应用属性对比技术,在一定程度上避免了对网页的重复分析和
采集,提高了信息的更新速度和全部搜索率。
由于网站的资源常常分布在网不同的机器上,信息采集系统从某个给定的网址出
发,根据网页中提供的超链接信息,连续地抓取网页(既可以是静态的,也可以是动态的)
和网络中的文件,将网的信息进行全部提取。
(4)搜索引擎
搜索引擎是指互联网上专门提供检索服务的一类网站,这些站点的服务器通过网络搜
索软件或网络登录等方式,将Internet上大量网站的.页面信息收集到本地,
经过加工处理建立信息数据库和索引数据库,从而对用户提出的各种检索做出响应,
提供用户所需的信息或相关指针。
用户的检索途径主要包括自由词全文检索、关键词检索、分类检索及其他特殊信息的
检索等。
(5)其他采集技术
①爬虫技术。网络爬虫(WebCrawler),又称为网络蜘蛛(WebSpider)或Web信息
采集器,是一个自动下载网页的计算机程序或自动化脚本,是搜索引擎的重要组成部分。
网络爬虫通常从一个称为种子集的URL集合开始运行,它首先将这些URL全部放到
一个有序的待爬行队列里,按照一定的顺序从中取出URL并下载所指向的页面,
分析页面容,提取新的URL并存入待爬行URL队列中,如此重复上面的过程,直
到URL队列为空或满足
您可能关注的文档
- 配电线路高跳闸、高报修、高投诉的防范.pdf
- 公开选拔领导干部面试题及答案全解.pdf
- 电力电子技术模拟试题及答案.pdf
- 人教版四年级数学下册第6单元小数的加法和减法测试卷(附答案 ).pdf
- 统编版五年级上册语文,第5课《搭石》阅读方法介绍及重要内容、重要知识点梳理.pdf
- 中国文学课翻译项目意义.pdf
- 设备采购、安装与调试管理方案.pdf
- 人教版八年级物理第三章《物态变化》第二节熔化和凝固同步练习 含答案.pdf
- 人教版初中化学九年级上册《第四单元 自然界的水:课题1 爱护水资源》教案.pdf
- 人教PEP版四年级英语下册期末质量评估试题(浙江台州椒江区2021年春真卷,含听力答案).pdf
文档评论(0)