中文搜索引擎中中文分词应用.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中文搜索引擎中中文分词应用

中文搜索引擎中中文分词应用   摘 要 网络信息的急剧增长给人们搜索信息带来一定的困难,搜索引擎的出现及时地解决了这个问题。而在搜索引擎中核心的部分之一是中文分词算法,它在一定程度上影响着检索的速度。简单介绍中文分词的重要性、方法以及现在存在的问题,对中文分词的进一步发展提供一定的依据,推动搜索引擎发挥越来越强大的作用。   关键词 搜索引擎;中文分词;网络信息   中图分类号:TP393.01 文献标识码:B 文章编号:1671-489X(2013)03-0067-02   Chinese Search Engine in Chinese Word Segmentation Application//Zhu Lili   Abstract The rapid increase of network information search information for people to bring certain difficulty. Search engine solute to the problem timely. The search engine is one of the core of the Chinese word segmentation algorithm. To a certain extent it affects the speed of retrieval. This paper focuses on the simple introduction about Chinese word importance, methods and the problems. To provide further development for the Chinese word segmentation. Allows search engines to play an increasingly strong role.   Key words search engine; Chinese word segmentation; network information   1 引言   随着科技时代的发展,网络越来越成为人们生活中的重要部分,特别是网络信息的急剧增长使人们获取信息的方式发生了极大的改变。相比于以前翻阅纸质书籍,现在的人们更喜欢在网络上寻找自己想要的信息,这不仅可以极大地提高搜索信息的效率,而且可以增加搜索信息的广度和深度。基于此,搜索引擎便应运而生,搜索引擎可以让人们在海量的信息中更快地搜索到自己想要的资源。而搜索引擎在面向用户接口这个层面上,比较重要的技术是中文分词技术,所以本文先简要地介绍一下搜索引擎,在此基础上进一步阐述中文分词技术在搜索引擎中的重要作用以及相应的应用。   2 搜索引擎   面对海量的网络信息,搜索引擎的出现给人们查找自己想要的资源带来了极大的便利。搜索引擎是一种在网络上应用的软件系统,它有自己的检索数据库,这个也是系统的核心部分,检索数据库的形成是先通过在Web上自行收集的大量的信息,然后对这些信息进行相应的处理,以便能够形成可以用于检??的数据库。从用户的角度来看,这个软件系统提供给了用户一个可以用于检索的界面,用户从这个界面中输入自己想要查询的内容,系统会根据用户输入要求,提供给相应的检索结果。搜索引擎的原理可以简单描述为三步:从网络上收集相应的网页——建立相应的索引数据库——在索引数据库中进行相应的检索。   搜索引擎的出现为网络信息的发展提供了很大的发展空间,由于搜索引擎的技术首先是在国外发展的,所以对于英文信息的搜索引擎技术现在来说已经是比较成熟的了,而对于中文信息的处理的搜索引擎相比较来说就没有那么完善。一方面来说是因为搜索引擎在中国出现得比较晚,加之中文的复杂性等原因,中文搜索引擎还需要进一步地发展完善。下面就对在中文搜索引擎中所用到的中文分词进行简要的介绍。   3 搜索引擎中的中文分词   3.1 中文分词的重要性   随着科技社会的快速发展,网络信息也越来越发挥着重要的作用,信息量也是愈加的丰富,在给人们带来便利的同时也带来了一些困扰,如何能够在浩海如烟的信息中快速地搜索到自己想要的信息?搜索引擎的出现及时解决了这个问题,如比较熟悉的百度、谷歌等网站都已经将搜索引擎做到了极致,使人们能够快速搜索到自己想要的资源。搜索引擎一般是以词为基本单位进行相应的检索,这样就要求将输入的中文句子切分成相应的词语,这就涉及到其中比较重要的技术——中文分词技术,它是机器翻译、信息检索的重要基础。   中文分词是什么呢?先来了解一下分词。分词就是将词语从一整个句子中划分出来,这个过程称之为分词。学习过英语的人都了解,英语词与词之间的间隔是

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档