- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网络信息搜索引擎的发展研究.pdf
翻囵瀣 翟豳 …a ts
信 息 技 术
网络信息搜索引擎的发展研究
谢安裕
(广东省梅州市工业学校 ,广东 梅州 514000)
摘 要:阐述了信息搜索引擎的原理分类及局限,从网络信息检索的机制、检索效果、智能化检索、多媒体检索等方面阐述了信息搜索引擎
的发畏趋势。
关键词:信息检索;搜索引擎;网络;趋势
I搜索引擎的原理 区域l生知识 ,因领域不同的专业性知识。 索结果可视化。搜索结果的呈现方式 ,结果可视
搜索引擎是对www站点资源和其他网络资 还有原因在于整个检身过程中,客户端的计 化,可以先看到每个网页长什么摸样 ,再决定是
源进行组织和检索的—类检索机制。其机制—般 算机知识起着一个终端的作用,强大的运算能力 否访问它。多途径的多媒体检索、多种媒体信息
包括数据采集和标引机制、数据组织机制、用户 和存储空间无法发挥作用,就造成以下的问题: 库的结合、多特征的综合检索、采用相关反馈和
检索机制。其中,数据采集机制按照一定规律和 搜索结果很难精确匹配;无法对检索结果进行提 自动标注技术、高维索引技术、用户查询接口实
方式对网络上www站点进行搜索。并将搜索到 炼;无法对不同的搜索引擎的结果进行综合比较 现多媒体信息综合检索在网络信息多样化和网
的www页面信息存人搜索引擎的临时数据库 ; 与提炼;搜索引擎使用方法不同造成用户理解和 络用户多样化的呼唤下,人们希望在网络上找到
搜索引擎的数据组织机制对www页面信息进行 使用困难;搜索结果手工下载效率低下;增加用 更丰富更实用的资源,不再漫无目的地查找,特
整理以形成规范的页面所以,并建立相应的索引 户的网络通信费;搜索结果中的匹配文档不可能 色搜索引擎便应运而生了。
数据库,搜索引擎的用户检索机制帮助用户以一 快捷地下载。 (1)图像搜索引擎。图像搜索引擎虽然还没
定方式检索引擎的索引数据库,以获得符合用户 4搜索引擎发展趋势 有成熟的产品,但是这项研究工作却紧锣密鼓的
需要的www站点或页面。 智能搜索引擎:智能搜索引擎是结合了人工 边彳j着:。据称,美国Purdue大学的研究:人员已经
2根据搜索引擎提取数据的方法,可将搜索 智能技术的新一代搜索引擎,它使因特网信息检 开发出了一种新的搜索引擎,这种搜索引擎不再
引擎系统可以分为三大类 索从基于关键词提高到基于知识或概念,并对知 使用关键词文本进行搜索,而是使用图像或者草
21目录式搜索引擎:是一种网站级搜索引 识有一定的理解和处理能力,能够实现分词技 图进行搜索。不就的将来,用户自己画一幅草图,
擎。目录式搜索引擎由分类专家将网络信宦按照 术、同义词技术、概念搜索、短语识别及机器翻译 搜索引擎就可以对数据库进行搜索,并找到所有
主题分成若干个大类,每个大类再分为若干个小 技术等。比如在表单中输入的问题.返回的答案, 与草图类似的图像。不过,这要求图像搜索引擎
类 ,依次细分,一般的搜索引擎分类体系有五六 这样就要把所有的问题全部添加到数据库中,每 能够快速处理超大容量数据库。这种技术不仅为
层,有的甚至十几层。先由程序 自动搜集信息,然 当用户提问的时候,数据库将会在数据库中检测 网民提供了方便,在生物、化学、医学等领域都可
后由编辑员查看信息,人工形成信息摘要 ,提供 查询结果,百度知道就是把用户的问题和正确答 能发挥极大的作用。
目录浏览服务和直接检索服务。由于目录式搜索 案添加到数据库中了,当你在知道中查询答案,那 (2)多媒体搜索引擎。FAST是国外著名的多
引擎的信息分类和信息搜集有人的参与,因此其 么将会检测到相关的词汇。智能搜索引擎实现数 媒体搜索引擎 ,很多同类搜索引擎都会引用此引
搜索的准确度是相当高的,缺点是需要人工介 据挖掘、知识发现、智能代理等。智能搜索在研究 擎的内容。在FAST搜索多媒体文件,可以同时
入、维护量大、信息量少、信息更新不够及时。 机器翻译(MT)的领域中,使用户可以
文档评论(0)