网站大量收购独家精品文档,联系QQ:2885784924

复旦大学献检索教研室.ppt

  1. 1、本文档共100页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
复旦大学献检索教研室

2005-09-10 复旦大学文献检索教研室 互联网学术信息查询 2009.11 网络检索工具 互联网基础知识 互联网检索工具基础 通用搜索引擎实例:Google 免费电子期刊查询 1. 互联网基础知识 CNNIC最新统计:(2008/12/31) 2.98亿网民,居世界第一 (半年内用过互联网的6周岁及以上中国公民) 博客用户数达1.62亿 手机上网网民达到1.176亿 1.2 互联网的互联原理 TCP/IP协议——通信的保证机制 IP地址——地址的标识技术 客户机/服务器系统——运作的基本模式 地址的标识技术——IP地址 识别主机的身份证,唯一性 域名(DN):即字符型的IP地址,域名的地址格式为: lib. shmu. edu. cn 主机名 机构名 网络类型 最高域名 [注] 需申请注册 常用网络类型代码 com 商业机构 org 非营利组织 edu 教育机构 gov 政府部门 net 网管组织 int 国际组织 mil 军事部门 info 信息机构 其他:.museum .coop .aero .pro…… 可用于限定信息来源出处,鉴别信息可靠性 鉴别信息可靠性时,不能仅以网络类型代码为标准,需进一步根据网站主办机构、性质等来判别。 1.3 互联网提供的主要服务 环球网(WWW/Web) 电子邮件(E-Mail) 远程登录(Telnet) 文件传输(FTP) 网格等 环球网(World Wide Web) 统一资源定位器(URL,网址) 是信息在网上的地址,用来定位和检索WWW上的文档。 由三部分组成 web服务器域名、文件路径、文件名 例如:/services/donation.htm 2. 互联网检索工具基础 且慢,让我先Google一下? 按工作原理划分 独立检索工具 主题指南/目录/网站查询(Directory) 由人工采集网站并进行分类,建成树状等级目录,保证了查准率,但查全率降低。 如:ODP(Open Directory Project) 、 Yahoo! 搜索引擎/网页搜索 通过Robot自动跟踪标引软件搜寻网页,自动进行关键词标引,它不需要人工干涉,查全率较高。 如:Google,All the Web 按工作原理划分 元搜索引擎(集成搜索引擎) 自身不采集信息,没有信息库,同时检索多个独立搜索引擎,以统一格式输出结果。信息量大,用时短。 Clusty、 Ixquick、MetaCrawler、搜星、万纬搜索等。 按检索内容划分 通用检索工具 是综合性的信息检索系统,它往往基于检索词去匹配相关的内容。时常也会因检出内容太泛而无法一一过目。 如:Google、Altavista、ODP、Yahoo!、百度 专业检索工具 是专业信息机构根据专业需求,将Internet上资源进行筛选整理、重新组织而形成专业信息检索系统,专业针对性较强。 如:Medical Matrix、HealthLinks、BIOME 3. 通用搜索引擎实例 3. 通用搜索引擎实例:Google 3.1 Google的概况 3.2 Google的特色 3.3 Google的搜索模块 3.4 Google的关键词检索规则 3.6 Google学者Scholar 3.7 Google使用偏好设置 3.8 其他检索引擎 3.1 Google的概况 Google源自DLI1(Digital Library Initiative 1)美国数字图书馆先导研究计划的一个项目。 搜索的网页:1兆+;图片:10 亿+ 拥有100多种界面语言和国际域名 在搜索引擎市场占有68.6%的份额 2006年4月12日Google将中文名“科高”改为谷歌,意为山谷之歌。 在世界各地拥有20个办事机构 总市值超1,788亿美元,超过IBM! (以上信息截止2008年) 3.2 Google的特色 可同时检索中英文等几十种语言。 检索响应速度极快,0.5秒内应答 PageRank专利网页级别技术与超文本匹配分析,客观评价网页的重要性,以提供相关性较高的搜索结果 智能化的“手气不错”功能,直接连接到可能最符合要求的网页 “网页快照”从服务器里直接取出缓存的网页。用不同颜色标记检索词,很醒目。 图像搜索工具。 3.4 Google关键词检索规则 必须检索:无需and,两词间空格默认and匹配,或用+表示,+之前必须留一空格,+之后不空格。 例:aspirin stroke;白血病 骨髓移植 或者检索:OR必须大写。 例:mri OR magnetic resonance imaging 排除检索:用-表示,但减号之前必须留一空格。 例:hepatitis -animal(不能用NOT)

文档评论(0)

qiwqpu54 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档