海量分词技术白书2 2.docVIP

  • 2
  • 0
  • 约1.02万字
  • 约 18页
  • 2016-10-01 发布于四川
  • 举报
海量分词技术白书2 2

海量中文智能技术白皮书 海量公司 20年月 序言 4 第一章 产品概述 6 1.1海量中文智能分词基础件简介 6 1.2 海量中文智能分词基础件应用前景 6 第二章 产品技术特点 7 2.1海量中文智能分词基础件的特点 7 2.2 算法特点 8 2.3基础件特点 8 第三章 产品功能介绍 10 3.1词形切分 10 3.2词性标注(高级版) 10 3.3关键词标注(高级版) 10 3.4支持的字符集标准 10 3.5语意指纹提取(高级版) 10 3.6分词颗粒度控制 11 第四章 运行环境 12 4.1 WINDOWS 12 4.2 LINUX 12 4.3 UNIX 13 第五章 海量中文智能分词的典型应用 14 5.1KM知识管理系统 14 5.2搜索引擎 14 5.3辞书出版 14 5.4信息服务 14 5.5网站信息发布 15 第六章 合作伙伴成功案例 16 6.1商务印书馆 16 6.2腾讯SOSO搜索引擎 16 6.3其他案例 17 附录A 数据辞典 18 附录B 市场部联系方式 18 序言 1.什么是中文分词?分词就是将连续的字序列按照一定的规范成词序列的过程。,在英文的行文中,单词之间是以空格作为自然分界符的,而中文只是字、句和段可以通过明显的分界符来简单划界,唯独词没有一个形式上的分界符,虽然英文也同样存在短语的划分问题,但是在

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档