- 1、本文档共89页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
图2-8Google搜索引擎的主页5.其他英文搜索引擎(1)LookSmart也是主要的目录索引之一,向包括MSN、AltaVista、Excite等在内的其他搜索引擎提供搜索内容。与ODP一样,其注册网站在合作伙伴搜索结果中排位往往也靠前。LookSmart在网站结构和内容上与其他目录索引大同小异,其目录中的网站排列也是根据字母顺序。它使用Inktomi的数据库提供二级网页搜索。图2-8是LOOKSMART搜索引擎的主页。(2)第二代搜索引擎只做后台技术提供者与大量应用人工智能是第二代搜索引擎的标志。第一代的搜索引擎公司后来演变成了门户网站,而第二代的搜索引擎厂商则成为像Inktomi、Google那样给网站提供技术与服务的ASP,或是在技术上采用了人工智能技术的厂商,如Askjeeves、Directhit等。第二代搜索引擎厂商的特点是只做后台技术的提供者。1)Inktomi2)Askjeeves3)Goto4)Google3.搜索引擎面临的挑战搜索引擎对自然语言提问没有理解能力;所有著名的搜索引擎都不支持中文或是对中文的支持极弱;搜索引擎收集的网页数量和其数据库的更新速度存在着不可调和的矛盾;搜索引擎无法与电子商务紧密结合;搜索引擎对多媒体内容的处理尚不成熟。4.新一代搜索引擎的特点AskJeeves。巧妙地将用户提问转化为系统已知的问题,然后对已知的问题进行回答,降低了对自然语言理解技术的依赖性;B。第一个为中国人写的商业化的互联网搜索引擎,信息量大,相关性好,刷新率高,速度快;G。最先将拍卖的概念引入搜索引擎服务,当用户检索某些词时,广告商可以通过竞拍使自己的网站在搜索结果中的排名提前,这就把电子商务的概念轻松地引入了搜索服务。MySimon。这是一个完全面向电子商务的搜索服务,它对同一种商品按价格的高低进行排序;Ditto。这是一个多媒体的搜索引擎,目前主要提供网上图像的搜索,已收集了超过200万个图像,并且大多经过人工的筛选,因而搜索结果质量较高。5.搜索引擎的未来从1996年起,搜索引擎技术开始注重网页质量与相关性的结合,这主要是通过三种手段:对网上的超链结构进行分析,如Infoseek和Google;对用户的点击行为进行分析,如Directhit(该公司被AskJeeves收购);与网站目录相结合。最新的趋势则是搜索的个性化和本地化:2.2.3搜索引擎的类型与特点目前发展最为迅速、最受人们欢迎的信息检索工具是WWW(互联网)上的检索工具,主要分为两类:主题指南和搜索引擎。其它检索工具,有Gopher、Archie、WAIS等,它们分别用来查询Gopher资源、FTP资源和WAIS资源。这些不同的工具为查询各种信息提供了多种途径。从最初的主题指南发展到独立型搜索引擎、混合式搜索引擎、元搜索引擎乃至分布式搜索引擎,折射出搜索引擎功能不断改进、性能日趋完善、更趋向智能化的检索特征。1.主题指南主题指南是搜索引擎的最初表现形式。是人工建立的、结构化的互联网网址主题类目和子类目,按照字母、时间、地点、主题等顺序进行排列,使用户通过浏览网络站点列表,检索有关信息。较为典型有Yahoo!、LookSmart、InfoMine等。主题指南由人工编制和维护,因此在信息的收集、编排、HTML编码以及信息注解等方面花费大量的人力和时间。它强调的是浏览功能,优点是采用人工干预提高了主题指南返回结果的相关性;缺点是很难检索到较深的信息,难于控制主题等级类目的质量,信息更新速度相对较慢,收录信息数量相对不足。主题指南主要适用于:用户进行笼统或较笼统的主题浏览和检索。当用户尚未形成很精确的检索概念时,采用主题指南作为检索起始点非常有效。除综合性主题指南之外,为了适应网上各种类型信息的发展变化,又出现了某些专业的主题指南,它由某一领域的专家编制和维护,在信息准确性和易于理解方面比综合性主题指南要好。2.独立型搜索引擎独立搜索引擎也叫关键词检索工具。这种搜索引擎实际上是定期搜索互联网(以WWW为主)并收集新网页信息的计算机程序。每个搜索引擎都有自己独有的搜索系统和一个包容互联网资源站点的独有数据库。其数据库由称为“Robots”(或Spiders、Crawler)的自动检索程序建立,不需人工干预。这是它与主题指南的最大区别。它具有检索面广、信息量大、信息更新速度快等优点,非常适用于特定主题词的检索。但因其检索噪音较大,为检索带来负面影响。3.混合式搜索引擎随着搜索引擎技术的不断发展,独立型搜索引擎多与主题指南合二为一,演化为兼具有分类浏览和关键词检索功能的混合式搜
您可能关注的文档
- 数据库及应用基础:第6章 报表.ppt
- 数据库原理与应用:第3章 关系数据库.ppt
- 数控机床故障诊断与维修教案.ppt
- 网络编程:第3章 C#和ASP.NET 3.5.ppt
- 网络编程:第4章 ASP.NET 3.5标准控件.ppt
- 网络资源的开发与利用:web of science数据库检索应用讲座.ppt
- 网络资源的开发与利用:第五章 网络信息在科研中的应用.ppt
- GB/T 30117.1-2024非相干光产品的光生物安全 第1部分:通用要求.pdf
- 中国国家标准 GB/T 30117.1-2024非相干光产品的光生物安全 第1部分:通用要求.pdf
- 中国国家标准 GB/T 9536.1-2024电气和电子设备用机电开关 第1部分:总规范.pdf
- 《GB/T 12668.7202-2024调速电气传动系统 第7-202部分:电气传动系统的通用接口和使用规范 2型规范说明》.pdf
- 《GB/T 15692-2024制药机械 术语》.pdf
- GB/T 15692-2024制药机械 术语.pdf
- 中国国家标准 GB/T 15692-2024制药机械 术语.pdf
- GB/T 19633.1-2024最终灭菌医疗器械包装 第1部分:材料、无菌屏障系统和包装系统的要求.pdf
- 中国国家标准 GB/T 19633.1-2024最终灭菌医疗器械包装 第1部分:材料、无菌屏障系统和包装系统的要求.pdf
- 《GB/T 19633.1-2024最终灭菌医疗器械包装 第1部分:材料、无菌屏障系统和包装系统的要求》.pdf
- 《GB/T 30117.1-2024非相干光产品的光生物安全 第1部分:通用要求》.pdf
- 《GB/T 33348-2024高压直流输电用电压源换流器阀 电气试验》.pdf
- GB/T 33348-2024高压直流输电用电压源换流器阀 电气试验.pdf
文档评论(0)