数据音频技术分析.pptVIP

  • 6
  • 0
  • 约7.3千字
  • 约 47页
  • 2016-06-13 发布于湖北
  • 举报
5.4.2 语音合成 除了副发音和韵律产生的问题外,语音识别还必须注意发音模糊问题。解决这个问题的惟一方式就是提供有关上下文的附加信息。 5.4.3 语音输入与识别 在语音输入处理的各种应用中,需要正确回答3个问题,即: 1)谁?语音输入依赖说话者的某种特性,这意味着语音输入能识别出说话者。计算机可用于识别说话者的声音指纹。 2)什么?语音输入的关键是检测语音内容本身。通常输入的语音序列产生一块文本。典型的应用有语言翻译系统。 3)怎么样?第三个问题有关如何研究语音采样。其典型应用如测谎仪。 音频技术中难度最大、也最具应用前景的当属语音识别,其潜在的商业应用前景使之一直是音频技术研究关注的热点。语音识别和语音合成相结合,实现了媒体转换。 5.4.3 语音输入与识别 语音识别一般是通过各种比较来完成的。 利用现有技术,可以实现一个包含有大约25 000词汇的依赖于讲话者的识别系统。语音识别中影响识别质量的问题主要是方言、情绪化的发音以及环境噪声等。 5.4.3 语音输入与识别 语音识别的原理,是将个人发音的特殊特征和由以前抽取的语音元素组成的句子做比较。这意味着这些特征通常被量化,用于被研究的语音序列。这—结果与现有的参考做比较,以将它定位于现有的语言单元之一。识别出的言词作为参数化的语言单元序列被存储,传输或处理。 5.4.3 语音输入与识别 具体操作通常使用专门的元件

文档评论(0)

1亿VIP精品文档

相关文档