第六章Web技术及网络信息搜索.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
自我介绍 姓名:张浩平 办公室:0248 手机E-mail:zhanghp@ QQ:1296014857 教材: 《Internet应用技术与实践》 共享邮箱: nl_computer@163.com 中的网盘 密码:xinxixueyuan HTML语言编写网页示例 (1)用记事本编写如下的文挡: html head title我的第一个 HTML 页面/title /head body pbody 元素的内容会显示在浏览器中。/p ptitle 元素的内容会显示在浏览器的标题栏中。/p /body /html (2)将文档以文件名“myhtml.html”保存。 (3)双击myhtml.html文件,在浏览器窗口就可以看到如下内容: 6.2 HTTP协议 6.3.4 IE浏览器安全常识 1.浏览器安全隐患 (1)病毒 (2)漏洞 (3)流氓工具 求职应注意的礼仪 求职时最礼貌的修饰是淡妆 面试时最关键的神情是郑重 无论站还是坐,不能摇动和抖动 对话时目光不能游弋不定 要控制小动作 不要为掩饰紧张情绪而散淡 最优雅的礼仪修养是体现自然 以一种修养面对两种结果 必须首先学会面对的一种结果被拒绝 仍然感谢这次机会,因为被拒绝是面试后的两种结果之一。 被拒绝是招聘单位对我们综合考虑的结果,因为我们最关心的是自己什么地方与用人要求不一致,而不仅仅是面试中的表现。 不要欺骗自己,说“我本来就不想去”等等。 认真考虑是否有必要再做努力。 必须学会欣然面对的一种结果被接纳 以具体的形式感谢招聘单位的接纳,如邮件、短信 考虑怎样使自己的知识能力更适应工作需要 把走进工作岗位当作职业生涯的重要的第一步,认真思考如何为以后的发展开好头。 Thank you 6.5.2 网络信息检索的特点 因特网检索与传统的文献检索大不相同,其特点主要表现为: (1)信息检索空间巨大 (2)良好的反馈能力和快速响应能力 (3)交互式作业方式 (4)用户界面友好且操作方便 6.5.3 网络信息检索存在的问题 (4)多媒体搜索效果不理想 (3)冗余信息过多 (2)查全率不高 (1)查准率不高 6.6搜索引擎 搜索引擎的是指自动从Internet搜集信息,经过一定整理以后,提供给用户进行查询的系统。 6.6.1搜索引擎的分类 基于“全文检索”的搜索引擎。 目录索引 非主流搜索引擎 元搜索引擎 ;集成搜索引擎 ; 免费链接列表;开放式分类目录(ODP); 6.6.2搜索引擎的工作原理 搜索引擎的自动信息搜集功能分两种:一种是自动搜索,另一种是提交网站搜索 。 一般搜索引擎定期的对因特网进行搜索,即每隔一段时间,搜索引擎采用一种称之为“蜘蛛”的搜索程序,对一定IP地址范围内的因特网的网站进行搜索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库。 蜘蛛程序(Spider),也称为网络爬虫,是一个自动提取网页的程序,是搜索引擎的重要组成部分。 对于搜索引擎来说,要抓取互联网上所有的网页几乎是不可能的,因此,许多搜索引擎的网络蜘蛛只是抓取那些重要的网页,而在抓取的时候评价重要性主要的依据是某个网页的链接广度和链接深度。 抓取网页的方法有广度优先和深度优先两个策略,广度优先是指网络蜘蛛会先抓取起始网页中链接的所有网页,然后再选择其中的一个链接网页,继续抓取在此网页中链接的所有网页。这是最常用的方式,因为这个方法可以让网络蜘蛛并行处理,提高其抓取速度。深度优先是指网络蜘蛛会从起始页开始,一个链接一个链接跟踪下去,处理完这条线路之后再转入下一个起始页,继续跟踪链接。这个方法有个优点是网络蜘蛛在设计的时候比较容易实现。 PageRank 算法 (1)如果一个页面被许多其他页面引用,则这个页面很可能就是重要页面; (2)如果一个页面尽管没有被多次引用,但被一个重要页面引用,那么这个页面很可能也是重要页面; (3)一个页面的重要性被均分并将传递到它所引用的页面中。 其中页面的重要程度量化后的分数就是 PageRank 值(简称PR值)。 搜索引擎的网站信息来源的另一条途径是由网站拥有者主动向搜索引擎提交网址,搜索引擎将主动提交的网址放入搜索引擎数据库,在一定时间内定向向该网站进行扫描,并将有关信息存入数据库,以备用户查询。 6.6.3搜索引擎优化 搜索引擎优化(Search Engine Optimization),简称SEO,是指通过采用易于搜索引擎索引的合理手段,使网站各项基本要素适合搜索引擎的检索原则,从而更容易被搜索引擎收录及优先排序。通常采用的方法是:

文档评论(0)

tk2469tk + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档