统计语言模型指南.docVIP

  • 12
  • 0
  • 约6.15千字
  • 约 6页
  • 2017-06-19 发布于湖北
  • 举报
统计语言模型 主要内容 概述 数学建模 一.统计语言模型概述 二.现有的主要统计语言模型 三.数据平滑方法 概述 我们为什么需要统计语言模型? 统计语言模型出现的历史: 1、从小规模受限语言处理走向大规模真实文本处理的。把这个新目标正式列入大会主题的是1990年在赫尔辛基举行的第13届国际计算语言学大会(Coling’90)。 2、1992年在蒙特利尔召开的第4届机器翻译的理论和方法国际会议(TMI-92)宣布大会的主题是:“机器翻译中的经验主义和理性主义方法”。公开承认,在传统的基于语言学和人工智能方法的自然语言处理技术以外,还有一种基于语料库和统计语言模型的新方法正在迅速崛起。 概述 首先成功利用数学方法解决自然语言处理问题的是语音和语言处理大师贾里尼克 (Fred Jelinek)。当时贾里尼克在 IBM 公司做学术休假 (Sabbatical Leave),领导了一批杰出的科学家利用大型计算机来处理人类语言问题。统计语言模型就是在那个时候提出的。十几年后,李开复用统计语言模型把 997 词语音识别的问题简化成了一个 20 词的识别问题,实现了有史以来第一次大词汇量非特定人连续语音的识别。 概述 历史上曾经先后出现过两个方法迥异的英语词性标注系统:TAGGIT系统拥有3000条上下文相关规则, 而CLAWS系统[6]完全采用概率统计方法。两个系统各自完成了1

文档评论(0)

1亿VIP精品文档

相关文档