- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网络的环境下信息检索技术的研究
网络的环境下信息检索技术的研究
摘 要:在网络开放的环境下,人们越来越离不开互联网,人们开始在网络上通过信息检索获取自己想要的信息,这样可以节省人们的时间,并且还能够更准确的获得其他相关知识,这一便捷的技术受到了人们的广泛关注,针对于此,本文就网络环境下的信息检索技术进行分析,以供参考。
关键词:网络环境;信息检索;检索技术;方法
中图分类号:TP391.3
在现代化社会发展中,计算机技术、网络技术、通信技术等在社会各行各业中得到了广泛的应用。互联网是世界上规模最大、资源最丰富的网络平台,人们可以通过互联网查询、检索信息,不仅方便快捷,还能够获取更多其他相关知识。但是从另一个方面来讲,正因为网络环境开放,导致网络信息资源出现了异构、分散的特性,极不利于人们深入开发、利用信息资源。这就需要我们在开放的网络环境之下对信息检索技术进行深入的研究,从而提高网络信息资源的利用率。
1 在开放的网络环境之下所采取的信息检索方法
1.1 信息浏览
在互联网中,信息浏览是最原始的信息检索方法,信息浏览也就是进行超文本文件结构的信息浏览,也就是在文档中通过建立超链接,用户也就可以从一个网页转到另一个相关的网页进行浏览,从而获取知识及相关知识。达到这种检索目的的主要原因是由于网页提供了相应的超链接,这就可以提高信息检索的效果。但是也需要清楚的知道,这种检索方法极容易让人们点击更多相关网页,偏离了最初的知识检索目标。
1.2 目录型网络资源检索工具
所谓目录型网络资源检索工具也就是通过专业的技术人员对网络信息资源进行鉴别、选择与整理,从而开发出既可以网络浏览又可以实现信息资源的检索的一个软件。达到这一检索目的的主要原因是由于专业人员在后台建立了一个大型的检索数据库,然后将网络信息资源进行分析、整理之后录入数据库当中,以供人们的检索。随着社会的发展,技术人员在录入网络信息资源的过程中,目录类范围不断缩小,这就更能够让自己获得想要的知识或者信息。这种检索方法正因为有技术人员的设定,因此其检索结果的相关性也有了一定的提高,但是受到条件的限制,建立的数据库依然比较小,这就在很大程度上限制了信息资源的数量,也不能够有效的提高系统管理人员的工作效率。
1.3 索引型网络信息资源检索工具
索引型网络信息资源检索工具是当前最常见的一种检索方式,也就是用户在搜索引擎中输入关键词就能够获得相关知识,使用户通过选择找到自己想要的知识。这种检索工具相对于上述两种检索工具而言具有明显的优越性,方便快捷,并且搜索的范围广,让用户获得更多的知识及相关知识。
2 信息检索时存在的问题
目前,用户在检索网络信息资源的过程中,大多都会通过搜索引擎获取。根据相关调查显示,搜索引擎有利于帮助用户得知更多新网站,现已成为人们检索信息的主要手段。由此看来,网民在信息获取等各种服务中已经离不开搜索引擎,但是也不得不知的是,大多数网民在利用搜索引擎检索信息的过程中还存在着许多问题,主要体现在以下几个方面:
2.1 长时间只适用1~2个搜索引擎
目前,随着计算机技术、网络技术的进一步发展,互联网中出现了多种多样的搜索引擎,并且每一种搜索引擎都具有不同的功能。但是很多用户在上网的过程中,一般都指挥采用1~2个搜索引擎进行简单的信息检索,而不能够更深入的认识,达不到最佳的检索效果。
2.2 很少使用或者并不了解布尔运算符号和高级搜索语法
一般情况下,用户在进行信息检索之前,都需要编写一个检索提问式,要求其不仅能够满足用户对信息检索的需求,还必须要经过计算机的识别。在编写这一检索提问式的过程中,我们就需要采用布尔运算符号对这些检索的关键词进行组合与搭配,从而更快的找到自己想要检索的信息,但是目前,大多数用户对此并不了解,很少将这种检索功能运用在信息检索当中。
2.3 粗略查看已搜索到的信息资源
用户在利用搜索引擎检索信息时,一般都会出现成百上千条信息,此时绝大部分的用户只是粗略的查看排列在前面的几条信息,这就忽视了后面多数有价值的信息。
3 搜索引擎的工作原理
搜索引擎的工作原理可以简单概括为:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。
从互联网上抓取网页利用能够从互联网上自动收集网页的Spider(又名为:Robot,Crawler,Worms,Wanders)系统程序,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集回来。
在索引数据库中搜索排序当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度
您可能关注的文档
最近下载
- 《北京市房屋租赁合同自行成交版》.doc VIP
- 机修工考试题库及答案.doc VIP
- 八年级数学趣味数学知识竞赛课件(比赛用) (共51张PPT).pptx VIP
- 机修工培训考试题库.pdf VIP
- 《古建筑木结构维护与加固技术标准》(GB_T 50165—2020)修订解析.pdf VIP
- 七年级数学知识竞赛课件 (共42张PPT).pptx VIP
- 八年级数学趣味数学知识竞赛课件(比赛用) (共51张PPT).pptx VIP
- 七年级数学趣味数学竞赛比赛用课件 (共48张PPT).pptx VIP
- 《少盐限油健康饮食》课件.ppt VIP
- 2022年初中数学趣味数学竞赛课件(共43张ppt).pptx VIP
文档评论(0)