CSW中文分词组件.docVIP

  • 18
  • 0
  • 约1.78千字
  • 约 2页
  • 2017-06-12 发布于北京
  • 举报
CSW中文分词组件 ? 软件介绍 一、中文智能分词简介 中文自动分词技术是对现代汉语序列文本语句,将其自动拆分为以词组为单位文本的技术。 二、应用范围 中文智能分词技术作为中文信息处理的核心和汉语自然语言理解的基础,其有着广泛的应用范围. 诸如:数据挖掘、文档分类、自然语言理解以及凡是涉及到信息/数据检索的各个领域。 三、应用范例 在当前中文信息检索过程中,由于汉语语言的特殊性,所检索出的结果往往差强人意。对搜索条件自动进行中文分词处理,是目前提高检索结果准确性的一种有效途径。 例如1: 搜索关键字:上海燃料化学公司 使用中文分词组件后可拆分为:上海 燃料 化学 公司 如数据库中存在的是” 上海市燃料化学总公司”,按通常的检索方法是很难检索出来的,采用中文分词技术拆分后,可对被搜索关键字进行分开匹配(Filed like ‘%上海%’ and/or Field like ‘%然料%’ and/or Field like ‘%化学%’ and/or Field like ‘%公司%’ )。从而有效避免因被检索内容中无的”上海然料化学公司”字符而导致不能正确检索出结果的现象。 例如2: 搜索关键字:网络蚂蚁中文版 使用中文分词组件后可拆分为:网络 蚂蚁 中文版 在进行检索时将被检索的内容与搜索关键字分开进行匹配( Field like like ‘%网络%’ and Fiel

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档