孔盼盼算法设计.docVIP

  • 7
  • 0
  • 约2.34千字
  • 约 8页
  • 2016-04-28 发布于贵州
  • 举报
辽 宁 科 技 大 学 课程设计说明书 设计题目: 中文分词程序设计与实现 学院、系: 装备制造学院 专业班级: 计算机09级2班 学生姓名: 杨彦天 指导教师: 迟呈英 成 绩: 2012年 3 月 2 日 目 录 需求分析 设计 编码与调试 结果分析 参考文献 总结 附录(程序源代码) 需求分析 随着社会的不断发展和科技的发达,在计算机领域中,中文信息处理这一过程越来越受到关注,西方语言在语句(或从句)内词汇之间存在分割符(空格),而汉语的词汇在语句中是连续排列的。因此,汉语词汇的切分(分词)在中文信息处理的许多应用领域,如机器翻译、文献检索、文献分类、文献过滤、以及词频统计等,是非常重要的第一步。 首先要研究的自动分词,自动分词是基于字符串匹配的原理进行的。迄今为止,已经有许多文献对各种分词方法进行探讨,其着重点或为分词的速度方面,或为分词的精度方面以及分词的规范。本文主要探讨分词的速度问题,通过实验对比和理论分析,说明我们所提出的算法是有效的。 目前人们所提出的分词方法,在考虑效率问题时,通常在词典的组织方面进行某种调整,以适应相应的算法,如最大匹配法

文档评论(0)

1亿VIP精品文档

相关文档