- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第07讲_收索引擎.ppt
第08讲 网络搜索引擎 一、搜索引擎的产生与发展 二、搜索引擎的概念 三、独立搜索引擎的原理与使用 四、搜索引擎的类型 一、搜索引擎的产生与发展 ◆手工查找阶段 1993年以前,用户查找信息采用的方法是从一个WWW服务器中的某一个URL开始,沿其中的超链(HyperLink)连接到另一个URL。手工查找既费时又慢,并且很难找到令人满意的内容。 ◆目录管理阶段 一些网络服务站点为了方使用户浏览阅读,组织一定的专家收集网上信息,并按一定的分类和主题进行组织,提供查询服务 ◆自动搜索阶段 从1994年开始出现网络自动搜索技术软件(robot、spider 、webcrawler、harvest、pursuit等),对Internet资源进行自动收集、组织并提供检索服务的一类信息服务系统。 ◆智能搜索阶段 提高查准率和查全率,并向专业化发展。 二、搜索引擎的概念 ◆ 广义的搜索引擎 泛指网络上提供网络信息检索服务的工具或系统。在网络环境下, 搜索引擎所扮演的角色与传统的手工检索工具在印刷版时代所扮演 的角色很近似,二者都是对信息资源进行搜集、整理,并提供多种 查询途径。因此,搜索引擎 又被称为网络检索工具。搜索引擎主要 面向网络信息资源,并通过Internet来提供服务。 ◆狭义的搜索引擎 主要指利用网络自动搜索技术软件(robot等),对Internet(主要 是Web)网络资源进行收集、组织并提供检索服务的一类信息服务系统。 三、独立搜索引擎工作原理 独立搜索引擎工作原理 主要由五部分构成: 数据采集(robot/spider):负责按照一定的方式和要求对网络资源进行搜集,并将搜集到的网页信息经网络传输,存储到搜索引擎的临时数据库中; 数据分析与标引(indexer):负责对收集到的网页信息进行分析,从中提取有检索或查询价值的内容——网页关键词、网页的分类类别等,并对关键词进行权值计算; 独立搜索引擎工作原理 数据组织:负责形成规范的索引数据库或便于浏览的层次型分类目录结构; 数据检索: 一定的方式检索索引数据库,获取符合用户需要WWW信息; 信息挖掘:负责提取用户相关信息,利用这些信息来提高检索服务的质量。根据用户以前检索行为的学习统计及其登记的信息,信息挖掘模块在个性化服务中起到关键作用 独立搜索引擎的使用 ◆ Yahoo! ◆ Google ◆baidu / ◆ NorthernLight ◆ Excite ◆ AltaVista Google搜索引擎简介 Google特点: 支持多语言速度快 搜索命中率高 “网页快照”功能 (能从GOOGLE服务器里直接取出缓存的网页) 集成化的工具条 单词英文解释和网页翻译 Google搜索引擎简介 基本搜索方法——逻辑“与”、“非”、“或”,即+,-,OR 1.与操作:搜索结果要求包括两个及两个以上关键字。 关键字之间用“+”或者空格表示。 2.非操作:搜索结果要求不包含某些特定信息。 关键字之间用“-”号表示。 ★“+”、“-”是字符(半角). 3.或操作:搜索结果至少包含多个关键字中的任意一个 关键字之间用“OR”表示,不能用“or”。 Google搜索引擎简介 Site——Site表示搜索结果局限于某个具体网站或者网站频道 Link——Link语法返回所有链接到某个URL地址的网页 Inurl——Inurl语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。 Allinurl——Allinurl语法返回的网页的链接中包含所有查询关键字 Intitle——Intitle语法返回的网页标题中包含第一个关键词,后面的关键词则出现在链接中或者网页文档中。 Allintitle——Allintitle语法返回的网页的链接中包含所有查询关键字 filetype——某一类文件中查找信息。 Google搜索引擎简介 Site——Site表示搜索结果局限于某个具体网站或者网站频道 “site”表示搜索结果局限于某个具体网站或者网站频道 示例:搜索包含“鲁迅”的中文新浪网站页面 搜索:鲁迅 site: 注:site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“http”以及“www”前缀;网站频道则只局限于“频道名.域名”方式。 Google搜索引擎简介 Link——Link语法返回所有链接到某个URL地址的网页示例:搜索所有含指向新浪
您可能关注的文档
最近下载
- (1000题)R2移动式压力容器充装考试题及答案.doc
- 2024年秋季新西师大版一年级上册数学全册教学课件(新版教材).pptx
- 权威2025年中央一号文件重点内容解读.pptx VIP
- 2025年教科版(2024)小学科学二年级上册(全册)教学设计(附目录).docx
- 2023年新版征信报告详细版征信报告模板-Word-可编辑-有水印.docx VIP
- 2025离婚起诉状 (打印版).pdf VIP
- 铁路运输行业发展简析(附铁路货运量、铁路客运量、周转量).pptx VIP
- 13.1 饮食与营养 第1课时(教学课件)生物苏科版2024八年级上册.pptx VIP
- 2023年新版征信报告详细版征信报告模板-Word-可编辑-有水印(1).doc VIP
- 中国城市人文地理——深圳.ppt VIP
文档评论(0)