理学语音信号处理ppt课件 胡航版 01章.pptVIP

  • 15
  • 0
  • 约1.13万字
  • 约 68页
  • 2018-07-31 发布于贵州
  • 举报

理学语音信号处理ppt课件 胡航版 01章.ppt

理学语音信号处理ppt课件 胡航版 01章

60 -- 70年代发展 ? 1960年 Fant发表的开创性工作“语音产生的声学理论” ? 60年代中期 数字信号处理算法的突破 – 1965年 快速傅里叶(FFT)算法 – 1968年 同态处理(Homomorphic Processing) – 70年代中 线性预测分析(LPC) – 70年代末 矢量量化; ? 70年代初 动态时间规正(Dynamic Time Warping,简称 DTW) ,隐马尔科夫模型(Hidden Markov Modeling.简称HMM). ? 70年代初 美国国防部先进技术研究项目管理局(DARPA) 启动语音理解系统研究计划 ? 开始应用数字计算机, 60年代出现了第一台以数字计算机为基础的孤立词语音识别器和有限连续语音识别器; 80年代以来– 近代语音处理技术 ? 语音编码技术 – 1980年2.4kb/s LPC-10 – 1988年4.8kb/sCELP标准FS-1016,16kb/s REAL编码标准(欧洲) – 90年代2.4kb/s MBE – G系列Model Based Vocoder ? 语音合成 – 1980年Klatt 串/并联共振峰合成器 – 基于规则和波形拼接的合成--TD-PSOLA语音合成 – 基于统计大语料库的合成--Corpus based 语音合成方法 – Trainable TTS – HMM based 语音合成方法 80年代以来–近代语音处理技术 ? 语音识别 – 基于HMM框架的统计模式识别算法发展与工程化 – 80年代中期开始美国DARPA委托NIST组织的一系列评测,对语音识别研究发展重要的影响 – 语音处理技术产品化热潮 ? 1985年开始IBM大词汇英语听写机Tangora ? 90年代初Dragon Dictate70000词识别系统 ? 1988年无限词汇的中文听写机研制成功 – 90年代初开始 ? CMU的Sphinx非特定人连续语音识别系统 ? 1997年IBM推出的中文ViaVoice ? VLSI和计算机技术发展带来的巨大推动 二、语音处理的发展历史(国内) 在国内,语音处理方面有代表性的研究单位有:清华大学、中国科学院声学所、西安电子科技大学、四达公司、中国科学院自动化所、微软中国研究院等。 国内有关语音技术的产品分为两大类:语音合成技术和语音识别技术。 二、语音处理的发展历史(国内) 我国语音处理研究的起步比先进国家晚一点,但在跟踪国外先进技术基础上,进步很快。尤其在语音识别方面,成果突出,如研制成功汉语听写机产品。这是因为,由于汉语音节种类较少,结构很规则,便于以音节为基础实现无限词汇识别,因而很快获得了可与国际先进水平相比拟的成果。在语音合成方面,有限词汇的语音合成器已在自动报时、报警、报站、电话查询服务、玩具等方面得到了广泛的应用。 返回 三、语音文件格式 两种类型的语音文件格式: Raw 格式, 没有文件头 raw 自我描述格式,有文件头 Wav Midi Aiff, au, voc Mpeg Rm, ra, ram 语音文件格式之重要参数 语音文件的参数 取样率 数码率(bps: Bits per second or Bits per sample ) 语音通道数:语音通道的个数表明语音产生的波形数,一般分为单声道和立体声道。单声道产生一个波形,立体声道则产生两个波形。采用立体声道声音丰富,但存储空间要占用很多。由于语音的保真与节约存储空间是有矛盾的,因此要选择平衡点。 取样精度:即每次取样信息量。取样通过模数转换器(AD转换器)将每个波形垂直等分,若用8位AD转换器,可把取样信号分为256等份;若用16位AD转换器,则可将其分为65536等份。显然后者比前者音质好。 语音文件格式之WAV格式 计算机中最常见的存放声音格式,就是WAV文件格式,其扩展名是 .wav。 WAV文件是以RIFF (resource interchange file format)的档案格式储存,含有不定长度的文件头(header)与数据(data),组成不定长度的区块(chunk)与子区块(sub-chunks),所存的数据是编码的声音信号,WAV文件支持线性波形编码调制(PCM)、ADPCM等波形编码实现。 WAV文件分成三个区块(chunk),分别是 “RIFF” chunk (12 bytes) “fmt” sub-chunk (variable, 16 bytes + extra) “data” sub-chunk (variable, size of sample data) 语音文件格式之WAV格式 表1-1 WAV文件组成 类别(Type) 长度(Size) 所含内

文档评论(0)

1亿VIP精品文档

相关文档