- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
人工智能技术在搜索引擎中应用
人工智能技术在搜索引擎中的应用
摘 要 通过介绍搜索引擎的分、工作原理及相关技术,对其结构体系进行简单分析。由于人工智能技术得到了快速发展,本文对搜索引擎如何运用人工智能技术进行了研究,并对搜索引擎的重要模块进行了详细分析,描述了搜索引擎的智能化发展方向。
关键词 人工智能;搜索引擎;应用
中图分类号:TP311 文献标识码:A 文章编号:1671-7597(2015)03-0079-02
Internet网络技术的快速发展,使网络已经成为了人们日常生活不可或缺的一部分,它作为信息发布、传播的主要方式,Web拥有几亿页面的分布式信息空间,目前仍然以130~200d翻一番的速度增加。Internet信息广泛,涵盖量很大,要从中迅速找出自己需要的信息,有一定难度。因此,人们研究开发了多种检索工具,以便自可以快速方便的找出自己想要的内容。随着科学技术的不断发展与成熟,网络搜索引擎得到了快速发展,它是以一定的策略在互联网中搜集、发现、提取、处理信息的过程,通过为用户提供检索服务,发挥其信息导航的作用。
1 搜索引擎技术
1.1 分类
①目录式搜索引擎。其特点主要是用人工方式或者半自动的方式搜集相关信息,编辑人员通过访问Web站点,等信息摘要形成之后便会根据站点的内容将其归类在预先设置的分类中,将站点的描述、URL置于此类别中,若用户需要查询某个关键词,搜索软件便会在预先存储的描述中搜索。部分目录也会接受用户提交的描述,当编辑人员认可此描述后,便会将其归类在相关类别当中,以供其他用户查询。此搜索引擎的优点是导航质量可靠,准确性高,如Yahoo;缺点则是人工介入过多,维护量及维修费用大,信息无法及时更新。
②基于Robot的搜索引擎。其特点是由称为Robot的机器人程序用某种策略自动发现并搜集互联网中的有关信息,通过索引系统自动建立信息索引,由查询接口按照用户输入信息检索索引库,然后将查询结果反馈给用户。其较为显著的一个特点是需要定期访问曾经搜集的网页,并刷新索引,去除无用链接,网页内容的变化也会出现在用户查询结果中。其优点是更新及时、不需要人工干预、信息齐全,如Google,缺点则是返回信息较多,且无用信息多,用户要在搜索结果中仔细筛选。
③Meta搜索引擎。其特点是自身无存放网页信息的数据库,用户查询某个关键词时,它可以将其查询请求转化为其他搜索引擎可以接受的形式,通过访问多个搜索引擎查询关键词,并对查询的相同结果进行排除,之后返回给用户。优点是覆盖面比较大,搜索效果好,缺点是具有局限性,无法充分发挥搜索引擎的功能。
1.2 工作原理及相关技术
搜索引擎的工作原理是通过一个Robot最大限度的收集WWW的网页,根据网页内容建立反向索引,用户想查询有关内容时,输入关键字作为查询条件,搜索引擎根据预先建立的单词索引或者网页库,检索符合要求的网页反馈给用户。通常情况下,搜索引擎由三部分组织,如下图所示(图1)。
①信息搜集系统。主要以Robot自动完成Robot在互联网中漫游时能够搜集大量的、多类型的新信息。互联网上信息含量大,更新速度快。为了确保搜索引擎信息具备一定的时效性与准确性,就要提高Robot的搜索效率,完善其搜索策略。搜索策略主要有两个内容,一是从URL集合开始,根据其超链接,以深度或者宽度优先的方法重复搜索互联网中的有关信息,URL可以是任何URL,但经常会包括很多链接站点;二是将Web空间根据IP地址、域名划分,搜索器需要对每个子空间进行不断
搜索。
②索引系统。Robot完成信息搜集后,要用索引系统程序对其收集的网页进行分析,并提取网页URL、页面内容包含的关键词等信息,采用有关算法对其进行计算,然后获得网页针对页面文字及关键词的相关度,用相关信息建立网页索引数
据库。
③查询接口。用户做出查询操作时,搜索引擎根据查询内容迅速检出相关文档,并对查询和文档的相关度进行分析,根据相关度大小对输出结果进行排序,反馈给用户。其目的在于方便用户获得更加及时、有效的信息。而查询接口的设计,能够适应人类思维方式。
2 人工智能技术在搜索引擎中的应用
现有搜索引擎效率较低,将人工智能技术引入搜索引擎中,不仅可以支持用户的搜索及浏览操作,还可以提供独立搜索的功能。
2.1 Robot的人工智能化
基于Robot的搜索引擎使用人工智能技术,其目的在于获得互联网中的信息资源,利用主页的超文本链接Web,然后通过URL引用一个HTML文档爬行到另一个文档。其算法采用深度优先、广度优先的搜索策略,广度优先能够跟踪页面中的任何URL,覆盖网页范围较广;深度优先则是轻松发现文档结构,并进行交叉引用。两种算法虽然可以检索出用户需要的内
您可能关注的文档
最近下载
- 人教版(2024)七年级地理上册第一章第三节《地球的运动》“学教评一致性”教学设计(含两课时).docx VIP
- 27t轴重铁路货车所装货物横向惯性力的仿真解析与实践启示.docx
- 【矩阵运营技巧】如何从零开始布局内容营销矩阵?_市场营销策划_私域流量运营攻略_矩形运营方法论_do.docx VIP
- 二零二五年度影视广告视频制作服务协议书.docx VIP
- 《数据要素服务平台数据资源服务目录建设指南》编制说明.pdf VIP
- 离职员工的信息技术权限回收.docx VIP
- 民间借贷(欠款)纠纷人民调解协议书范本7篇.docx VIP
- 供应商产品批准程序.pptx VIP
- 《记念刘和珍君》课件19张 .ppt VIP
- XLC15000-IA 履带起重机额定起重量手册(2023 年08月第1版).pdf VIP
原创力文档


文档评论(0)