- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
网络搜索引擎
★搜索技巧★ 1.提炼搜索关键词 学会从复杂搜索意图中提炼出最具代表性和指示性的关键词,对提高信息查询效率至关重要,这方面的技巧是搜索技巧的基础。 如:1)交通银行是什么性质的银行?可提炼出关键词:”交通银行” “性质” 2)搜索与秦朝历史文化有关的资料,可提炼关键词:“秦始皇”、“兵马俑”。 3)搜索”公元907年公元950年”我国处于哪个朝代。分析出关键词”历史年表” 2.细化搜索条件 搜索条件越具体,返回的结果就越精确,有时多输入一两个关键词效果完全不同。 如: 1)要了解中国戏剧中京剧的服饰及脸谱知识,搜索词可为“京剧”、“脸谱”。 2)“钓鱼”与“钓鱼”、“网络” 3.用好搜索引擎的高级检索功能 检索工具是通过利用其高级检索功能来反映对提问表达式的精确与深度构造,所以从某种程度上讲,高级检索功能是反映其总体搜索水平高低的重要指标。学会用布尔逻辑、限制检索和一些特殊功能可以提高检索效果。 4.不总是google 每种搜索引擎具有不同的特点,用不同的搜索引擎进行查询得到的结果常常有很大的差异,只有选择合适的搜索工具才能得到最佳结果。 5.学习搜索的经验 多向高手学习、多查询介绍搜索技术的信息,多交流、多总结优秀搜索工具和数据库,在利用搜索工具前先阅读一下引擎相关指令、自身的操作、定义符及规则。 中文搜索引擎指南网 WWW信息资源 FTP信息资源 Blog信息资源 Telenet信息资源 BBS 、新闻组信息资源 P2P信息资源 ★学术数据库和收费网站信息资源 这三类资源可见度较高,但每个搜索引擎最多能搜到其中的40% 大多数情况下,搜索引擎对这几类资源无能为力,只能另想办法查找。 看得见和看不见的网站 关于搜索的一些思想 不是互联网上所有的信息都能被搜索引擎搜集。 动手前多动脑。 不要盲目信任搜索得到的信息。 不要期望一次搜索解决问题。 * 主要讲解google搜索语法,但将来流行后,或许成为一种通用标准。 * * * * * 文献检索与利用 第七讲搜索引擎与网络信息检索 李 楠 linan@ 搜索引擎的概念 搜索引擎是以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航目的的网络检索工具。 它并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。 搜索引擎的工作原理就像超市 索引生成器 (网页数据库) 爬行器 (搜索软件) 查询检索器 (用户查询) 因特网 利用能够从互联网上自动收集网页的Spider系统程序,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集回来。 第一步:从互联网上抓取网页 因特网 第二步:建立索引数据库 由索引系统程序对收集回来的网页进行分析,提取相关信息(包括网页所在URL、编码类型、页面内容包含的关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容中及超链中每一个关键词的相关度(或重 要性),然后用这些相关信息建立网 页索引数据库。 第三步:检索界面的建立 当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。 最后,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。 每个搜索引擎都必须向用户提供一个良好的信息查询界面,一般包括分类目录及关键词两种信息查询途径。 4.搜索引擎的发展历史 元搜索 引擎 1995 Yahoo! 1994 Gopher 1993 Archie 1990 第一代 目录式搜索 Google 1996 Baidu 1999 …… 第二代 全文式搜索 搜索引擎举例:Google及其使用技巧 WHY Google? 80 亿网址——世界上最大的搜索引擎 PageRank——使网页排名客观公正 遵从关键词的相对位置——只返回包含所有关键词的网页 Google的高级检索语法 逻辑检索: Boolean operator(AND 、OR 、NOT) 检索限制: “…” define: site: filetype: inurl: intitle: 其他: link: related:
原创力文档


文档评论(0)