搜索引擎的智能化和知识库系统在其中的应用.docVIP

搜索引擎的智能化和知识库系统在其中的应用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE PAGE 1 搜索引擎的智能化和知识库系统在其中的应用   摘 要:分析传统搜索引擎与智能化搜索引擎,并以此为基础讨论了知识库系统在智能搜索引擎中的应用。   关键词:搜索引擎;知识库;智能化   中图分类号:TP273+.5 文献标识码:A   The Intelligent Search Engine and Knowledge Base System in Which the Application   HU Feng-hua,GUO Dan-feng,LIU Bing   (Computer and Information Technology Institute, Henan Normal University,Henan Xinxiang 453007)   Key words: search engine; Knowledge base system;intellectualization   随着互联网网站页面的激增和用户队伍的不断壮大,搜索引擎越来越成为人们上网浏览时的重要工具,用以在浩瀚的网站页面的海洋中迅速地找到自己所需的信息。这种市场的需求刺激着搜索引擎的技术不断地走向完善。但是从用户的角度来看,当前的搜索引擎主要存在以下几个方面的不足。   1 信息检索质量不高   搜索引擎通常依赖于自动建立的摘要,该摘要一般取自Web页的主题或前几行内容形成的,不一定能够反映实际情况。   2 检索方式单一   搜索引擎一般提供分类浏览的查询方式和关键词的全文检索,不能实现概念检索,不能从文献的多个方面对检索提问进行限制,只能就某一关键词或者概念进行笼统的检索。   3 搜索引擎对信息的标引深度不够   目前,搜索引擎检索的结果往往只提供一些线形的网址和包括关键词的网页信息,与人们对它的预期存在较大的距离,或者返回过多的无用信息,或者信息丢失,特别是对特定的文献数据库的检索显得无能为力。   4 信息收集与检索的分离   搜索引擎进行信息的收集和查询是两个分离的过程,缺少有机的结合。系统无法根据用户的检索要求进一步提供相关信息,用户不能依据有关提示进行理性的检索,操作比较机械。   5 智能搜索引擎功能特点   5.1智能型的自然语言技术   智能型的自然语言技术包括“自然语言搜索”和“动态关联词、联想词提示”技术。内建完整的“布尔逻辑运算组合”的搜索条件和“邻近搜索”功能,配合“智能型快速响应模式”,有效提高搜索速度和精确度。用户可灵活选择欲搜索的数据库,配合“中文同音”、“中英文近似概念”、“简繁转换”、“通配字符搜索”、“词组搜索”和“多字段平行检索”等多项智能搜索功能,从而更加高效、便捷获取有用信息。   5.2灵活的检索机制   提供多重模板设计功能,可按照用户自身需求轻松修改搜索结果的显示画面;并可依据不同的搜索方式,套用可获得不同的搜索结果的模板文件。提供“机动权值排序机制”、“阶层式分类目录”、“动态关联词、联想词提示”等功能,向用户提供更友好的搜索界面,增加搜索结果的适用性。   5.3强大的索引功能   采用“多线式资料获取机制”、“平行索引模式”、“动态文件分析技术”及“实时差异式索引更新技术”等多种功能,有效提高文件与数据库的索引速度,大幅降低索引等候时间和更新周期。提供“多重索引数据库”架构及“群组式分类目录”功能,缩短资料索引时间,灵活整合文档资料。   6 知识库系统在智能搜索引擎中的应用   6.1知识库系统   知识库系统包括知识的获得、利用和管理三个方面。知识库、推理机及存贮器是知识库系统的三个组成要素。知识库系统的核心组成部分是知识库和推理机。知识库是以一致的形式存储知识的机构,推理机构则是为了使用知识库内的知识执行推理的控制机构。   6.2在智能搜索引擎中的应用   目前的搜索引擎具有关键词检索和目录查询的缺点,为了克服这些缺点,应该采用自然语言理解技术来进行自然语言智能答询。   下面就是当前智能搜索引擎在知识库系统中所采用的一些自然语言理解技术。   6.2.1智能分词技术   关键词查询的前提是将查询条件分解成若干关键词。可以利用语义知识库进行总结,获得每个词出现的概率及词与词之间的关联信息,就可能有效地排除各种歧义,大幅度提高分词的准确性,从而准确地表述查询请求和文档信息。   6.2.2同义词处理   汉语词语之间复杂性的另一个方面是同义词的问题,同一个词组往往有许多不同的意思,处理同义词的一种方法是在语义知识库中人工构造同义词表,对专用领域的搜索引擎,这种方法是非常有效的。另外一种方法是从语义知识库中自动取得同义词关系,给出一个查询的关键词,搜索引擎能主动联想到与其同义或意思相近

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档