- 1、本文档共69页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
43搜索引擎的高级使用
九、Google学术搜索 九、Google学术搜索 十、百度新闻 十、百度新闻 十、百度新闻 软文! 讨论时间 找资料首选( ) A 百度 B Google C 问别人 D图书馆 E 其他 最常用的搜索引擎( ) A 百度 B Google C 搜搜 D Yahoo E 其他 对如何使用搜索引擎的其他策略: 八、按文件类型搜索 八、按文件类型搜索 五、限定域名地址检索 限定搜索某个特定网站或某类网站中的信息。 【百度】site: (“”) 【谷歌】site: 【例如】奥林匹克 site: 奥林匹克 site:.gov 六、限定网页特征检索 检索式 百度 谷歌 举例 网页网址中 inurl: (“”) allinurl: 如inurl: (“云南农业大学”) 网页标题中 title:(“”) allintitle: 如title:(“云南农业大学”) 网页文本中 allintext: 五、限定网页特征 五、限定网页特征 五、限定网页特征 五、限定网页特征 五、限定网页特征 五、限定网页特征 七、网页快照 网页快照,英文名叫Web Cache,又称网页缓存。搜索引擎在收录网页时,对网页进行备份,存在自己的服务器缓存里,当用户在搜索引擎中点击“网页快照”链接时,搜索引擎将Spider系统当时所抓取并保存的网页内容展现出来,称为“网页快照”。 七、网页快照 七、网页快照 七、网页快照 八、其他 (1)类似词检索。搜索引擎可能会使用同义词代替原始查询中的某些字词。在字词前添加腭化符号 (~) 可同时搜索该字词及其同义词。 如:搜索[~食品成分]会同时得到“营养成分”的搜索结果。 八、其他 (2)占位符(截词检索)。对于任何未知字词或“通配符”字词,都可在查询时加上占位符。 【百度】不支持;【谷歌】* 【例如】省*就是赚* 八、其他 (3)搜索数字范围。用两个半角句号(不加空格)隔开两个数字可查看日期、价格和尺寸等指定数字范围的搜索结果。如果仅使用一个数字和两个句号可表示上限或下限. 【百度】不支持 【谷歌】 .. 【例如】相机 500 元..1000 元 世界杯冠军..2000 八、其他 八、其他 检索式 百度 谷歌 时间限定 可能是搜索引擎爬虫爬到该网站的时间,而不是该网页发布的日期。 无特殊标识 无特殊标识 语言限定 无特殊标识 无特殊标识 地区限定 无 无特殊标识 八、其他 (4)时间、语言和地区限定 九、其他 九、其他 九、其他 不通过Google搜索引擎的结果,直接进入Google认为最相关的网页。 九、其他 九、其他 九、Google学术搜索 九、Google学术搜索 4.3搜索引擎的高级使用 网页的组成 搜索引擎的原理 搜索引擎的高级使用 网页的组成 (1)IP地址和域名地址,是搜索引擎和我们进入网站的唯一途径,如百度有一个IP地址为。由于IP地址不方便记忆,我们通常使用域名地址(如)。由 DNS服务器将域名地址翻译为该域名所对应的IP地址。 (2)网页地址,俗称网址。 Internet上的每一个网页都具有一个唯一的名称标识,通常称之为URL(统一资源定位符)地址,这种地址可以是本地磁盘,也可以是局域网上的某一台计算机,更多的是Internet上的站点。 (3)网页标题,在网页的源文件中,以title/title将其标识出来。如:title 欢迎访问云南农业大学主页!/title;当然,有时候网站为了提高其搜索引擎的蜘蛛爬虫的命中率,会在title中加入足够多的内容,如一个名为“中国论文发表网”的网站,其标题的内容包括:title论文发表、发表论文、发表文章、期刊合作、教育论文发表、科技论文发表、经济论文发表、职称论文发表、学术论文发表、论文协/title (4)网页正文。 网页的组成 搜索引擎的原理可以看做三步:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。 它并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。 它也不能真正理解网页上的内容,它只能机械的匹配网页上的文字。 搜索引擎 一、高级检索 二、逻辑检索 三、精确检索 四、限定文件类型检索 五、限定域名地址检索 六、限定网页特征检索 七、网页快照 八、其他 九、Google学术搜索 十、百度新闻 大纲 一、高级检索 一、高级检索 一、高级检索 一、高级检索
文档评论(0)