商业信息检索实验教学指导书..docVIP

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
商业信息检索实验教学指导书.

上海商业学院 计算机与电子信息学院 《商业信息检索》实验(实训)教学指导书 2007 年 8 月 实验一 搜索引擎技能训练 实验目的 对网络常见的搜索引擎进行了解,熟悉相关搜索引擎的使用方法和技巧,对信息检索的过程有一个基本认识。 实验环境(硬/软件要求):微机:每人1台; 软件:Windows2000,Office2000,IE 实验内容 1、根据搜索要求完成相关的搜索任务;2、给出查询结果,列出搜索到的网页数量和项目,并分析实际任务和结果的差距有多大。 实验指导: 1、搜索包含两个及两个以上关键字的网页和项目 指导:一般搜索引擎需要在多个关键字之间加上“ ”,而Google无需用明文的“ ”来表示逻辑“与”操作,只要空格就可以了。 搜索任务:搜索所有包含关键词“搜索引擎”和“历史”的中文网页 搜索:“搜索引擎 历史” 搜索结果要求不包含某些特定信息 指导:Google用减号“-”表示逻辑“非”操作。“A –B”表示搜索包含A但没有B的网页 搜索任务 :搜索所有包含“搜索引擎”和“历史”但不含“文化”、“中国历史”和“世界历史”的中文网页 搜索结果至少包含多个关键字中的任意一个 指导:Google用大写的“OR”表示逻辑“或”操作。搜索“A OR B”,意思就是说,搜索的网页中,要么有A,要么有B,要么同时有A和B 。 搜索任务:搜索如下网页,要求必须含有“搜索引擎”和“历史”,没有“文化”,可以含有以下关键字中人任何一个或者多个:“Archie”、“蜘蛛”、“Lycos”、“Yahoo”。 4、通配符使用 指导:很多搜索引擎支持通配符号,如“*”代表一连串字符,“?”代表单个字符等。Google对通配符支持有限。它目前只可以用“*”来替代单个字符,而且包含“*”必须用“”引起来。比如,“”以*治国“”,表示搜索第一个为“以”,末两个为“治国”的四字短语,中间的“*”可以为任何字符。 搜索任务:搜索第一个为“以”,末两个为“治国”的四字短语的页面。 5、对搜索的网站进行限制 指导:“site”表示搜索结果局限于某个具体网站或者网站频道,如“”、“”,或者是某个域名,如“”、“com”等等。如果是要排除某网站或者域名范围内的页面,只需用“-网站/域名”。 搜索任务:1)搜索中文教育科研网站()上关于搜索引擎技巧的页面2)搜索新浪科技频道中关于搜索引擎技巧的信息 注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“http://”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。 6、找找谁和你链接 指导:用link:来获得和目标网站的链接。查询link:siteURL,就会显示所有指向那个URL的网页。举例来说,链接www.G会向你显示所有指向GOOGLE主页的网页。但这种方法不能与关键字查询联合使用。 搜索任务:搜索和上海商学院首页链接的网页 7、在某一类文件中查找信息 指导:“filetype:”是Google开发的非常强大实用的一个搜索语法。也就是说,Google不仅能搜索一般的文字页面,还能对某些二进制文档进行检索。目前,Google已经能检索微软的Office文档如.xls、.ppt、.doc,.rtf,WordPerfect文档,Lotus1-2-3文档,Adobe的.pdf文档,ShockWave的.swf文档(Flash动画)等。其中最实用的文档搜索是PDF搜索。PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。目前Google检索的PDF文档大约有2500万左右,大约占所有索引的二进制文档数量的80%。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。 搜索任务1):搜索几个资产负债表的Office文档 搜索任务2):搜索一些关于搜索引擎知识和技巧方面的PDF文档 8、搜索的关键字包含在网页标题中 指导:网页标题,就是HTML标记语言title中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。用 “intitle”和“allintitle”对网页标题进行搜索。 搜索任务:查找日本明星藤原纪香的照片集 。可以用,intitle:藤原纪香 写真集来获得相关网页。 评分标准 满分100分,包括: 1.内容:70分 2.格式:15分 3.美观:15分 实验报告形式(纸质/电子) : 电子 搜索工具背景介绍 Google(www.G)是一个搜索引擎,由两个斯坦福大学博士

文档评论(0)

sfkl + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档