一种扩展的汉语统计二元文法语言模型.pdfVIP

  • 19
  • 0
  • 约8.77千字
  • 约 4页
  • 2017-08-09 发布于安徽
  • 举报

一种扩展的汉语统计二元文法语言模型.pdf

信号处理 184 一种扩展的汉语统计二元文法语言模型 田斌 易克初 (西安电于科技大学练台业务网国家重点蛮验室西安710071) [摘要]本文提出了一种扩展的统计投语二元吏法语言模翌J,以汉语的同一个句子中的展有效预测词对来 弥补二元文法的不足.有效的描述了}又语中词语组合的长距离位移现象。同时提出了最小复杂度准则的有效 词对篾现算法,克服了互信息准则忽略了各种语言预测单元信息覆盖的缺点。这种语言模型比传统词组合模 型计算复杂度低,训练可靠,且克服了一般语言模型集成中盲目插值、不能结合实际上下文的缺点。 关键诃:语音识别,汉语统计语言模型,语言模型复杂度,互信息准则,词组合信息 在语音识别中.台理地利用上下文相关信息来提高文字或语音的识别率是一种很重耍的研究方法“1。在 汉语拼音输入方法和汉语语音识别中,语言模型还担负着汉语拼音到宇的转换作用。语言模型的目的是提供 一个词(或字)序列的概率a设W=w。w:w。,则 .p【盼’1=Ptwlw’!w~)=P(w1)尸【w2IWl)尸(w31w1W2)…P(wⅣIWlW:WⅣ) (1)

文档评论(0)

1亿VIP精品文档

相关文档