现代信息查询与应用 实践四 典型搜索引擎训练.pptVIP

现代信息查询与应用 实践四 典型搜索引擎训练.ppt

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
现代信息查询与利用 现代信息查询与利用 * * 实践内容 (第1讲) 搜狗是搜狐公司于2004年8月3日推出的全球首个第三代互动式中文搜索引擎,域名为。 搜狗的产品线包括了网页应用和桌面应用两大部分。 网页应用以网页搜索为核心,在音乐、图片、新闻、地图领域提供垂直搜索服务,通过说吧建立用户间的搜索型社区; 桌面应用则旨在提升用户的使用体验:搜狗工具条帮助用户快速启动搜索,拼音输入法帮助用户更快速地输入,PXP加速引擎帮助用户更流畅地享受在线音视频直播、点播服务。 实践四 典型搜索引擎训练  信息工具与资源 实践内容 实践3.1:搜索引擎高阶利用(实践1学时) (1)通过上机实践掌握Google、Baidu的初高级检索功能和一些特色功能; (2)通过上机实践掌握学术搜索的途径和方法; 一 知识点回顾 搜索引擎, Search Engine 是指通过网络搜索软件或网站登陆等方式,将互联网上大量网站的页面收集到本地,经过加工处理而建库,从而能够对用户提出的各种查询作出响应,提供用户所需的信息的一种工具。 由搜索模块,索引模块,检索模块和用户接口四个部分组成, 从检索系统来看它实质是对 WWW 站点资源和其它网络资源进行标引和检索的一类检索系统机制。 参见教材13.2.1 一 知识点回顾 参见教材13.2.1 搜索引擎的原理,可以看做三步: 从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。 搜索引擎并非直接搜索互联网,也是搜索它的索引数据库。 索引数据库的更新速度直接影响搜索引擎是否可以搜索到最新的资料。  常用搜索引擎的搜索技巧比较 baidu google 雅虎 搜狗 搜索技巧??? ---实践重点 百度的高级检索 逻辑与 双引号 逻辑或 逻辑非 逻辑与:空格或+, 如“计算机 防火墙”。 逻辑或:| ,如“计算机 | 电脑” 。 逻辑非:-, 例如,要搜寻“武侠小说”,但不含“古龙”的资料,则可输入“武侠小说 - 古龙”。 百度不支持 “通配符”,要求所输入的关键词完整、准确,一字不差,才能得到最准确的资料。 Google的高级检索 逻辑与 双引号 逻辑或 逻辑非 46种语言 246国家、地区 参见教材13.2.2(P280-281) Google的高级检索 逻辑与 双引号 逻辑或 逻辑非 Google支持逻辑运算:在词前加上一个减号(“-”, 英文字符),在减号之前留一空格表示排除搜索某个词语;在关键词中间留空格,Google会在关键词之间自动添加“AND”; Google 不使用“词干法”、不支持“通配符”(*) 搜索;不区分英文字母大小写,所有的字母均当做小写处理;给词语加上双引号可进行短语精确搜索。Google将连字号、斜线、句点、等号和省略号当作短语连接符。 Google允许用户直接在键盘上输入汉语拼音来检索相关事物 例如:输入sichuanfengjingmingsheng,检索结果提示:您是不是要找:四川风景名胜。用户在输入拼音时,字母中间不能留有空 ,否则Google会误认为是英文。 参见教材13.2.2(P280-281) 百度(baidu)高级搜索语法 专业文档搜索——“filetype:”(DOC、XLS、PPT、PDF、RTF、ALL) 把搜索范围限定在网页标题中——intitle 把搜索范围限定在特定站点中——site 把搜索范围限定在url链接中——inurl 精确匹配——双引号和书名号(加上书名号的查询词,有两层特殊功能,一是书名号会出现在搜索结果中;二是被书名号扩起来的内容,不会被拆分) 要求搜索结果中不含特定查询词——减号语法 Google高级检索技术 具有特殊功能的查询字包括?filetype、define、site、cache 、info 、link,inurl,allinurl,intitle,allintitle。 Filetype用于查找特定的文档, 输入格式为:“关键词 filetype:**”,**为文档类型,Google可以支持13种非HTML文件的搜索,包括PDF文档、icrosoft Office (doc, ppt, xls, rtf)、Shockwave Flash (swf)、PostScript (ps)和其它类型文档; 如输入“冒险岛 filetype:swf”即搜索有关冒险岛的Flash文档。 Define用于查看字词或词组的定义, 输入格式为:“define 词 ”中间有一个空格,该操作符与您需要其定义的字词之间不留空格, 如“define 知识经济”即获得有关知识经济定义的列表。 参见教材13.2.2(P281-282) Google高级检索技术 Site用于表示在某个特定的域或站点中

文档评论(0)

flyben + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档