2015第六章技术与信息搜索.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
自我介绍 姓名:张浩平 办公室:0248 手机E-mail:zhanghp@ QQ:1296014857 教材: 《Internet应用技术与实践》 共享邮箱: nl_computer@163.com 中的网盘 密码:xinxixueyuan HTML语言编写网页示例 (1)用记事本编写如下的文挡: html head title我的第一个 HTML 页面/title /head body pbody 元素的内容会显示在浏览器中。/p ptitle 元素的内容会显示在浏览器的标题栏中。/p /body /html (2)将文档以文件名“myhtml.html”保存。 (3)双击myhtml.html文件,在浏览器窗口就可以看到如下内容: 6.2 HTTP协议 6.3.4 IE浏览器安全常识 1.浏览器安全隐患 (1)病毒 (2)漏洞 (3)流氓工具 6.5.2 网络信息检索的特点 因特网检索与传统的文献检索大不相同,其特点主要表现为: (1)信息检索空间巨大 (2)良好的反馈能力和快速响应能力 (3)交互式作业方式 (4)用户界面友好且操作方便 6.5.3 网络信息检索存在的问题 (4)多媒体搜索效果不理想 (3)冗余信息过多 (2)查全率不高 (1)查准率不高 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 6.6搜索引擎 搜索引擎的是指自动从Internet搜集信息,经过一定整理以后,提供给用户进行查询的系统。 6.6.1搜索引擎的分类 基于“全文检索”的搜索引擎。 目录索引 非主流搜索引擎 元搜索引擎 ;集成搜索引擎 ; 免费链接列表;开放式分类目录(ODP); Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 6.6.2搜索引擎的工作原理 搜索引擎的自动信息搜集功能分两种:一种是自动搜索,另一种是提交网站搜索 。 一般搜索引擎定期的对因特网进行搜索,即每隔一段时间,搜索引擎采用一种称之为“蜘蛛”的搜索程序,对一定IP地址范围内的因特网的网站进行搜索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库。 蜘蛛程序(Spider),也称为网络爬虫,是一个自动提取网页的程序,是搜索引擎的重要组成部分。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 对于搜索引擎来说,要抓取互联网上所有的网页几乎是不可能的,因此,许多搜索引擎的网络蜘蛛只是抓取那些重要的网页,而在抓取的时候评价重要性主要的依据是某个网页的链接广度和链接深度。 抓取网页的方法有广度优先和深度优先两个策略,广度优先是指网络蜘蛛会先抓取起始网页中链接的所有网页,然后再选择其中的一个链接网页,继续抓取在此网页中链接的所有网页。这是最常用的方式,因为这个方法可以让网络蜘蛛并行处理,提高其抓取速度。深度优先是指网络蜘蛛会从起始页开始,一个链接一个链接跟踪下去,处理完这条线路之后再转入下一个起始页,继续跟踪链接。这个方法有个优点是网络蜘蛛在设计的时候比较容易实现。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. PageRank 算法 (1)如果一个页面被许多其他页面引用,则这个页面很可能就是重要页面; (2)如果一个页面尽管没有被多次引用,但被一个重要页面引用,那么这个页面很可能也是重要页面; (3)一个页面的重要性被均分并将传递到它所引用的页面中。 其中页面的重要程度量化后的分数就是 PageRank 值(简称PR值)。 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile . Copyright 2004-2011 Aspose Pty Ltd. 搜索引擎的网站信息来源的另一条途径是由网站拥有者

文档评论(0)

gcv458 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档