第5章数据音频技术.pptVIP

  • 1
  • 0
  • 约1万字
  • 约 60页
  • 2017-02-09 发布于重庆
  • 举报
第5章数据音频技术

5.4.1 语音输出 语音输出涉及到机器如何生成语音的问题,在这方面的主要挑战是,如何使得语音输出系统能够实时地生成语音信号,例如,自动地把文字转化为语音。某些应用(如语音报时)采用有限的词汇表来处理这一任务,但大多数采用的是广泛的词汇表。 机器输出的语音必须是可以听懂的,而且应该听起来很自然。其中可懂性是强制而自然的事情,可以增加用户的接受度。 5.4.1 语音输出 与语音输出相关的几个重要术语是: 1)语音基本频率,是语音信号中最低周期信号部分。它体现在嗓音中。 2)音素,是最小的语音单位之一,用于区分语言或方言中的两个发音。它是最小的有意义的语言学单位,但并不携带内容。 3)音位变体,确定了作为语音环境的函数的音素变化。 4)词素,是有意义的语音学单位,在自由或受限的形式中都包含的最小且有意义的部分。 5)嗓音,由声带的振动产生。嗓音强烈地依赖于说话者。 6)非嗓音,由声带张开产生,这些声音相对独立于说话者。 5.4.2 语音合成 音频技术的一个重要方面是语音合成,即将普通正文合成为语音。如图5-5所示。 图5-5 使用时间域声音连接的语音合成系统 5.4.2 语音合成 第一步涉及到转录,或将文本翻译成相应的音标。大部分方法使用一个包含大量单词或仅仅是音节或音调组的词典。这样的词典创建非常复杂,可以是单独实现的或是几个人使用的普通词典,其质量可通过相互作用的用户干预

文档评论(0)

1亿VIP精品文档

相关文档