inter互联网检索课件.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
inter互联网检索课件

INTERNE检索 Internet起源于美国,1969年开始实现的Arpanet (Advanced Research Project Agency Network)计划,其目的是测试建立基于分组交换协议的网络的可行性,检验该网络在其一部分遭到打击并受到破坏的情况下,保持信息通畅的能力。 Internet在中国 Internet在中国 WWW浏览 World Wide Web简称WWW或Web,也称万维网。它不是普通意义上的物理网络,而是一种信息服务器的集合标准。 搜索引擎 Search Engine 搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库 搜索引擎,也不能真正理解网页上的内容,它只能机械的匹配网页上的文字 检索技巧 分析检索的主题 选择合适的搜索引擎 抽取适当的关键词 正确构造检索式 及时调整检索策略 了解查询目的和要求 信息类型(全文、文本、图像、声音等) 查询方式(浏览、分类检索、关键词检索等) 查询范围(全文、网页、标题、FTP、软件、外文等) 查询时间 选择合适的搜索引擎 GOOGLE 可搜索所有网站,用户界面相当好。并且具有一定的大写、名词识别能力的快速搜索引擎,它的数据库是最大的,能找到别的搜索引擎所不能找到的东西。 百度 拥有目前世界上最大的中文搜索引擎,具有高准确性、高查全率、更新快以及服务稳定的特点,在中文的某些信息搜索方面,百度甚至比GOOGLE更胜一筹。 抽取适当的关键词 如何抽取关键词: 使用名词或物体做关键词 检索式中使用2-3个关键词 要注意同义词、近义词、相关词或同一术语的不同表达方式。如,internet、 web 、www 正确构造检索式 及时调整检索策略 对固定短语,用“”括起来进行检索,以提高检索的精确度。如,“worle wide web” 高级搜索语法 检索词出现位置限定: 标题:intitle 网站:site 文件类型限定:filetype:文件名后缀 支持13种非HTML文件的搜索:pdf, doc, rtf, ppt, xls, swf, ps等 Intitle (在GOOGLE:allintitle) 格式: 百度: 关键词B intitle:关键词A GOOGLE:关键词B allintitle:关键词A 含义: 所有搜索结果的网页的标题中都要包含“关键词A”。 SITE 格式: 百度 : 关键词A site: 含义: site是限定在某个网站内搜索关键词A FILETYPE 格式:关键词A filetype:文件格式后缀名 含义:只收集相同文件格式的信息 电子邮件 本文观看结束!!! 辛弃疾:《青玉案》 “众里寻她千百度” 。 Sergey Brin Larry Page “Google”来自于数学名词“Googol”, Googol表示一个 1 后面跟着 100 个零。 * TCP/IP—Transfer Control Protocol/Internet Protocol即传输控制协议/网际协议 中国国家公用经济信息通信网(ChinaGBNET) 地址是IP协议提供的一种地址格式, 它为Internet上的每一台主机分配一个网络地址,是运行TCP/IP协议的唯一标识。 XXX.XXX.XXX.XXX 0~255 (天津理工大学) IP DNS(domain name system)域名控制系统 主机名.机构名.顶层域名 从左到右,域的范围变大。具有实际含义,比IP地址好记。 天津理工大学 Internet上几乎在每一子域都设有域名服务器,服务器中包含有该子域的全体域名和地址信息。Internet每台主机上都有地址转换请求程序,负责域名与IP地址转换。 com 商业机构 org 非营利组织 edu 教育机构 gov 政府部门 net 网管组织 int 国际组织 mil 军事部门 info 信息机构 Alan Emtage发明Archie 自动搜索各个FTP主机中的文件, Life on the Internet. 从互联网抓取网页 建立索引数据库 检索排序 搜索引擎的原理: 一个完整的搜索引擎包括四个部分: ★信息收集系统(机器人或蜘蛛) ★存贮和管理系统(数据库) ★检索系统( 包括对检索结果的评价系统) ★用户界面 扩大检索范围,提高查全率的方法: 1、考虑同义词或近义词(使用布尔逻辑符or连接) 2、选择较大检索范围的字段如摘要 3、使用截词符 4、使用上位词(如飞行器?航天飞机?载人航天飞机)

文档评论(0)

baoyue + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档