- 1、本文档共15页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第3章-搜索引擎及网络信息检索
第3章 搜索引擎及网络信息检索 3.1 基本知识 3.1.1基本概念 1.搜索引擎 1)搜索器 2)索引器 3)检索器 4)用户接口 2.域名 域名 当所使用的系统没有域名服务器,只能使用IP地址例如“3”,不能使用域名,例如“”。现在已经开通了中文域名,顶级域名包括“.公司”、“.网络”、“.中国”、“.政务”和“.公益”。 3.1.2 搜索引擎的优点和缺点 搜索引擎现在成为网络信息检索最重要的指路标,几乎达到了无所不搜的地步。但是目前的搜索引擎普遍存在着以下缺点,使得搜索引擎还无法完全代替本书4-8章介绍的专门的检索工具。例如质量参差不齐,信息的分类加工欠规范,各搜索引擎在检索指令的输入格式与输入内容上存在差异并难以兼容,缺乏通行易用的检索方法与技巧;没有统一的网络信息分类标准,令网络用户无所适从,而且网络信息分类难以与传统的文献分类融合,与常见的学科及知识体系之间缺乏必要的内在联系,使得网络信息的分类体系对知识面或学科的覆盖率达不到要求,对专业性较强的深度信息的查全率较低;建立资源索引时针对性不强,搜索速度慢,死链接过多,重复信息及无效信息过多;对资源不具有选择和价值判断的能力,排序结果不理想,难以搜索根据用户访问而临时动态生成的网页,查全率下降。据调查,功能最强大的搜索引擎最多能覆盖16%的网络信息资源。依照网络信息呈几何级的增长,搜索引擎覆盖的信息资源量还将有所下降。 3.1.3 搜索引擎的类型 依据不同的原则,网络搜索引擎可划分成不同的类型。 根据搜索引擎的数据检索机制划分 可分为分类型、主题型。 代表性的目录式分类搜索引擎是Yahoo、搜狐、新浪网站。 代表性的主题型搜索引擎是Google、百度(Baidu)网站。 按检索内容划分 分为综合型、专题型和特殊型。综合型搜索引擎在采集标引信息资源时不限制资源的主题范围和数据类型,又称为通用型检索工具。例如常见的Google、新浪、搜狐和网易,网罗百科,信息种类繁多。 专题型搜索引擎专门采集某一主题范围的信息资源,并用更为详细和专业的方法对信息资源进行标引描述。例如针对生物专利的搜索引擎、科技信息搜索引擎Scirus、重点学科导航系统、学科信息门户。 3.1.4主题搜索引擎的关键词语法规则 1.自动将关键词拆分进行模糊查询 2.按关键词进行精确查询 3.检索式的运算符号 如果想要得到最佳的搜索效果,就要使用搜索的基本语法来组织要搜索的条件。 例如:搜索引擎的字段俗称高级搜索。 (1)intitle。限定网页的标题,intitle的意思是所有搜索结果的title中都要包含“关键词A”。例如检索清华大学主页,排除仅仅含有介绍“清华大学主页”词组的其它网页,可以输入“intitle 清华大学”。 3.2 典型的搜索引擎 1. Google 2)Google的搜索语法 Google的基本检索算符是:空格、减号和大写英文“OR”。 逻辑“与”(and)用空格表示。用减号“-”表示逻辑“非”。注意:这里的“+”和“-”号,是英文字符,而不是中文字符的“+”和“-”。此外,操作符与关键字之间,不能有空格。 Google不支持通配符,如“*”、“?”等,关键字后面的“*”或者“?”会被忽略掉。Google对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。Google的关键字可以是词组(中间没有空格),也可以是句子,但是,用句子做关键字,必须加英文引号。 2. 百度() 3. 搜狐(/) 4. 新浪网(/) 6. 特殊型搜索引擎 网络上的信息资源丰富多样,为了查寻所需要的资料,用户往往使用Infoseek、Yahoo和Excite一类的检索引擎,但是,要查找一些专门的信息,如人名录、软件、新闻组、邮件列表、图像、视频、音频等,则必须使用特殊的检索工具。 3.3 搜索引擎的检索技巧 3.3.1常规的检索技巧 1.分类查询 2.关键词查询 一般来说,首次检索时不要把条件限制得过于严格,最好是检索出一些结果后再使用其它限定条件,在结果中做二次检索。下面是百度的“在结果中找”的界面,就是二次检索。 3.5 免费科技信息检索示例 【例题】检索克隆的多利羊的科技信息,强调排除非科技类信息。 【题解】确定关键词是“Dolly”,如果用Google搜索,结果是“Dolly Parton(一位著名的乡村歌手)”,改用科技信息搜索引擎SCIRUS,检索结果是“Dolly cloned (克隆羊) ”的科技信息。 思考题 1.搜索引擎的类型有哪些? 2.主题搜索引擎的关键词语法规则主要是哪些? 3.Google的高级检索方法主要有哪些? 综合实习题 中国从俄罗斯购进的第一艘现代级驱逐舰被命名为什么号? 1982年世界杯足球赛的冠军队是哪一个队? 古代琴师伯牙以《高山流
您可能关注的文档
最近下载
- 初中历史教师备课与授课.ppt VIP
- 62推销理论(教案)(商务谈判与推销).docx VIP
- 眼科学---巩膜扣带术.ppt VIP
- 2024年山东省平原县事业单位公开招聘教师岗笔试题带答案.docx VIP
- 新世纪全国高等中医药院校教材(第一版).doc VIP
- 初中语文2025届中考常考易错字词汇总(多音字+形声字+易错字形+易错成语)_可搜索.pdf VIP
- PADI开放水域潜水员理论考试A卷.docx VIP
- 社会责任全套培训记录表(含附属全套电子表格表).xls VIP
- 路科笔试真题完整版1.5.1.pdf VIP
- (人教版)八年级物理上册《第一章机械运动》单元测试卷含答案.docx VIP
文档评论(0)