- 1、本文档共74页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
3.通用搜索引擎实例
2005-09-10 复旦大学文献检索教研室 第五章 互联网信息综合查询第一节 互联网基础知识 一、互联网技术举要 二、互联网信息的特点 三、互联网信息的的评价与鉴别 (一)IP地址及域名 (二)万维网 (World Wide Web, WWW, Web) (三)Web 2.0 (四)局域网代理服务器设置 (一)IP地址及域名 IP地址 互联网标识上网主机地址的编号 IPv4协议规定的IP地址长度为32位,由四组小于256的十进制构成 例: 7 该IP是北京邮电大学图书馆技术部的一台主机 (一)IP地址及域名 域名(Domain) 为了便于记忆而产生的与数字IP地址对应的字符型IP地址。(需申请注册) 典型的域名由4个部分组成 例: 从左至右四段依次为:主机名、三级域名、二级域名和顶级域名,其顶级域名为国别顶级域名。 有的域名只有3个部分 例: 此类域名的顶级域名是网络类别代码。 常用网络类型代码 com 商业机构 org 非营利组织 edu 教育机构 gov 政府部门 net 网管组织 int 国际组织 mil 军事部门 info 信息机构 其他:.museum .coop .aero .pro…… (二)万维网(World Wide Web, WWW, Web) 万维网:基于超文本传输协议(http协议),通过含有超级链接的超文本(Hypertext)方式来进行网上信息浏览的工具。 统一资源定位器(URL):即网址 网站与网页 网页:万维网的上网主机中提供访问的一个网页文件 网站:是网页的集成,一般来说,网站是机构或个人用于介绍自己或提供服务的站点,即一个网站一般代表一个机构(或个人) (三)Web 2.0 以Blog、TAG、SNS、RSS、Wiki百科等应用为核心,依据六度分隔、xml、ajax等新理论和技术实现的互联网新一代模式 可以读写的互联网, Web1.0我们网上冲浪,Web2.0我们是波浪制造者。 让互联网找回Internet的真正含义:平等、交互、去中心化。 (四)局域网代理服务器设置 IE浏览器的“工具”下拉菜单→选择“Internet 选项”→点击“连接”选项卡→单击对话框右下方的“局域网(LAN)设置”按钮。 二、互联网信息的特点 无序性:信息杂乱无序,网页的变化、更迭、新生、消亡等随时发生 多样性:文件格式多样,内容包罗万象 新颖性:网上实时播报、网络新媒体中信息在第一时间被披露 对话性:更多直接交流的机会,零次信息多 开放性:大量灰色文献、边缘文献反映了原始数据和第一手资料 三、互联网信息的评价与鉴别 范围:网页性质、主题领域、目标用户层次、信息深度、时间范围、类型等 准确性:有明确的来源出处、标注网页责任者、信息客观性等 权威性:主办者资质、核实信息的方式、版权保护 新颖性:信息是否动态更新 三、互联网信息的评价与鉴别 独特性:信息提供的优势、特别的服务功能等 稳定性:网站连接及检索的速度、链接清楚且维护良好 费用:上网连通费用、全文等信息及服务是否要付费 第二节 搜索引擎 一、搜索引擎概述 二、通用搜索引擎 三、学术资源搜索引擎 四、其他搜索引擎 一、搜索引擎概述 (一)搜索引擎的概念 检索因特网信息最常用的检索工具,它是提供万维网上信息资源检索和导航服务的专门站点或服务器。 (二)搜索引擎的种类 独立搜索引擎 元搜索引擎 独立搜索引擎 通过搜集万维网的网页信息,建立自己独立的网络信息数据库供用户检索。 如: Google、Yahoo!、AltaVista、搜狐等 元搜索引擎 又称集成搜索引擎,自身不采集信息,没有自建的数据库。它将用户搜索请求预处理后,提交给多个选定的独立搜索引擎同时检索,并对返回结果进行整合,以统一的格式输出。 如:Clusty、Ixquick、Mama、MetaCrawler等 二、通用搜索引擎 Google() Yahoo! Search() 目录查询与网页检索途径比较 (一)Google() Google的检索规则 Google简单检索规则: 默认检索:必须检索,两词间空格默认and匹配 或者检索:OR必须大写 排除检索:-表示,减号之前须空格,其后不空格(不能用NOT) 短语检索:双引号扩起词组或短语 对大小写不敏感 截词符:* 自动拼写检查 Google的检索规则 Google简单检索规则: 检索词出现位置限定: 标题:allintitle 网址:allinurl 内文:allintext 链接:allinanchor 例:allinurl:acm搜索网址内含单词acm的网页 文件类型限定:filetype:文件名
文档评论(0)