- 1、本文档共38页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
网络信息资源与搜索引擎解析
3、搜索引擎的类型 全文搜索引擎(Full Text Search Engine) 通过从互联网上提取各网站的信息(网页文字为主)而建立的数据库中检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户。 Google baidu 目录式搜索引擎(Search Index/Directory) 以人工方式或半自动方式搜集信息,依据一定的标准对网络资源进行选择、评价、形成摘要,并将信息置于事先确定的分类框架中。 Yahoo! Open Directory /view/637a1c976bec0975f465e23e.html 元搜索引擎(Meta Search Engine) 又称集成式搜索引擎。多个独立搜索引擎的集合,通过一个独立的用户界面,同时对多个搜索引擎进行检索操作,并将从各独立引擎返回的结果进行处理,作为自己的结果返回给用户。 返回结果信息量更大、更全,但准确性较前两者低些,用户往往需做进一步的筛选。 WebCrawler InfoSpace 组成:WWW服务器,搜索程序(如spider、robot),索引数据库(包括成千上万甚至上亿个网页),检索程序(用来处理用户的检索请求) 4、搜索引擎的原理 面对Internet,各搜索引擎的能力和偏好不同,抓取的网页各不相同,排序算法也各不相同。 大型搜索引擎的数据库储存了互联网上几亿至几十亿的网页索引,但也只能占到互联网上普通网页的不到30%,不同搜索引擎之间的网页数据重叠率一般在70%以下。 我们使用不同搜索引擎的重要原因,就是因为它们能分别搜索到不同的内容。而互联网上有更大量的内容,是搜索引擎无法抓取索引的,也是我们无法用搜索引擎搜索到的。 你心里应该有这个概念:搜索引擎只能搜到它网页索引数据库里储存的内容。 5、检索功能 布尔逻辑 and\or\not 短语检索 双引号 查找特定格式的文献 filetype:类型名 如:.xls、.ppt、.doc、.rtf、.pdf、.swf等 对搜索的网站进行限制 site:网站名 如:site: 不用带“http://” 搜索的关键词包含在URL链接中 Inurl:关键词 搜索的关键词包含在网页标题中 intitle :关键词 如:intitle:精品课程 搜索网页正文中包含的文字 intext:关键词 1.4学术搜索引擎 常用中外文(学术)搜索引擎 中 文 外 文 Google中文学术搜索 百度 CNKI知识搜索 读秀学术搜索 Google Scholar Scirus Scitopia INFOMINE …… Google 学术搜索的功能 : 从一个位置方便地搜索各种资源 查找报告、摘要及引用内容 通过您的图书馆或在 Web 上查找完整的论文 了解任何科研领域的重要论文 例:Contextual influences on career values 创建于1998年,提供多语种的产品与服务,全球规模最大的搜索引擎。 创建于2000年1月,是目前全球最大的中文搜索引擎和重要的中文信息检索与传递技术供应商,现为中国网民最常用的搜索引擎。 SCIRUS Scirus 是目前互联网上最全面、综合性最强的科技文献门户网站之一,由Elsevier科学出版社开发。 Scirus可检索免费资源和期刊资源。涵盖超过1.05亿个与科技相关的网站,包括9,000万个网页,以及1,700万个来自其它信息源的记录,这些信息源包括:Science Direct, IDEAL, MEDLINE on BioMedNet, Beilstein on ChemWeb, US Patent Office, E-Print ArXiv, Chemistry Preprint Server, Mathematics Preprint Server, CogPrints和NASA等。 网站: 上机习题: 100元人民币换成泰铢是多少? 获得诺贝尔奖的印度人有哪几个? 近日新浪科技()上有一则英探险家完成11次登顶珠峰的报道,请找出这则报道,给出全文链接和检索式。 利用检索功能,搜索photoshop相关的使用技巧,给出检索式和结果截图。 利用检索功能,搜索霍金的《时间简史》PDF格式文件,给出检索式和结果截图。 利用搜索引擎、OA网站等途径,检索搜集“知识管理(knowledge management)”相关的中外文信息资料。给出检索过程和结果截图。 网络信息资源与搜索引擎 百度 google 上师大图书
您可能关注的文档
最近下载
- (完整版)党员发展对象试题题目和答案.pdf VIP
- 2025年天翼云高级运维工程师认证参考试题库资料(含答案).pdf
- 石油企业质量安全环保论文.docx VIP
- 水处理药剂投标文件格式.docx VIP
- AI 软件开发行业市场调研分析报告.docx
- 0.中国中铁建筑施工典型异常工况安全处置工作指引宣贯材料.pptx VIP
- ANCA相关性血管炎的诊治.ppt
- 石油健康安全环保论文.doc VIP
- 阅读理解专项+标题的含义及作用++++课件(共29张ppt)++2023-2024学年统编版语文七年级上册.pptx VIP
- GB_T 1094.11-2022 电力变压器 第11部分:干式变压器.docx VIP
文档评论(0)