- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 搜索 信息时代 互联网时代的 江湖 NO YES or * 常用搜索引擎 信息时代 (国内无法访问) * 搜 索 引 搜索引擎的英文为search engine。搜索引擎是一个对互联网信息资源进行搜索整理和分类,并储存在网络数据库中供用户查询的系统,包括信息搜集、信息分类、用户查询三部分。 搜索引擎涉及多领域的理论和技术:数字图书馆、数据库、信息检索、信息提取、人工智能、机器学习、自然语言处理、计算机语言学、统计数据分析、数据挖掘、计算机网络、分布式处理等,具有综合性和挑战性。 搜索引擎的用途:对普通网民而言,搜索引擎则仅仅是一种查询工具,作为工具,使用者要了解搜索引擎的功用、性能,探讨并掌握其使用方法和技巧;对商家来说,搜索引擎是一种赢利的产品或服务;而作为产品,搜索引擎商要研制、改进和创新其搜索技术;作为服务,搜索引擎营销商要研究搜索引擎优化和推广。利用搜索引擎的目的不同,构成了搜索引擎研究的不同群体和对搜索引擎不同角度不同侧重的研究。 擎 * 建立索引 蜘蛛抓取的页面文件分解、分析,并以巨大表格的形式存入数据库,这个过程即是索引(index).在索引数据库中,网页文字内容,关键词出现的位置、字体、颜色、加粗、斜体等相关信息都有相应记录。 工作原理 搜索引擎派出一个能够在网上发现新网页并抓文件的程序,这个程序通常称之为蜘蛛(Spider)。 搜索引擎从已知的数据库出发,就像正常用户的浏览器一样访问这些网页并抓取文件。搜索引擎通过这些爬虫去爬互联网上的外链,从这个网站爬到另一个网站,去跟踪网页中的链接,访问更多的网页,这个过程就叫爬行。这些新的网址会被存入数据库等待搜索。所以跟踪网页链接是搜索引擎蜘蛛发现新网址的最基本的方法,所以反向链接成为搜索引擎优化的最基本因素之一。搜索引擎抓取的页面文件与用户浏览器得到的完全一样,抓取的文件存入数据库。 原理概述 搜索词处理 用户在搜索引擎界面输入关键词,单击“搜索”按钮后,搜索引擎程序即对搜索词进行处理,如中文特有的分词处理,去除停止词,判断是否需要启动整合搜索,判断是否有拼写错误或错别字等情况。搜索词的处理必须十分快速。 搜 索 * 炫耀技术 目录索引 元搜索 引擎 特殊目的 全文索引 搜索 分类 非主流索引 * “ 全文搜索引擎是名副其实的搜索引擎,国外代表有Google,国内则有著名的百度搜索。它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。 ” 全文索引 * 中坚 目录索引 目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询。目录索引例如第一分类目录 ( )、新浪分类目录搜索。 * 元搜索 元搜索引擎(META Search Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。在搜索结果排列方面,有的直接按来源排列搜索结果;有的则按自定的规则将结果重新排列组合。 * 垂直搜索(视频、小说搜索) 集合式搜索(类似元搜索) 门户搜索(提供搜索服务) 免费链接列表(小型的目录索引) 非主流索引 * 提高搜索效率 选择恰当的搜索方式 选择准确的关键词 例如:阅兵和阅兵 70 使用高级检索工具 利用网页快照 * 本地化 服务化 智能化 信息检索的趋势 * 知 识 产 培养保护知识产权、信息安全与良好的计算机使用道德 网络环境为信息共享、信息交流、信息服务创造了理想空间,网络技术的迅速发展和广泛应用,为人类社会的进步提供了巨大推动力。然而,正是由于互联网的上述特性,产生了许多安全问题,譬如信息泄漏、信息污染、信息不易受控等安全问题。加上近年来计算机病毒严重地侵入计算机系统,不安全性就显得更为突出。1994年我国颁布了《中华人民共和国计算机信息系统安全保护条例》,条例中明确规定了全国计算机信息系统的安全保护工作。 同学们要注意计算机的安全、信息安全、知识产权的保护。在本节课中,我们在网络上查找资料,下载一些软件等,这些操作都涉及到信息安全和知识产权的问题。搜索信息的过程中,我们要正确上网,不浏览不健康的网站,合法获取网络信息资源,不侵犯他人的知识产权。在网络安全方面,同学们要保护好自己的计算机,当然更不能攻击别人的计算机。总之,我们要注重保护知识产权、信息安
文档评论(0)