- 1、本文档共778页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 1 章 绪 论;1.1 意义;
; 语音处理的应用背景和学科基础 ; 智能语音技术:使信息时代的各种信息机器像人一样“能听会说”的技术。;1876年Bell发明电话;
1947年贝尔实验室发明语谱图仪—语音识别研究的开始;
50年代出现第一台口授打字机和英语单词语音识别器;
60年代出现第一台以数字计算机为基础的孤立词语音识别器和有限连续语音识别器;;70年代动态规划技术、隐马尔可夫模型、线性预测技术和矢量量化码书生成方法用于语音编码和识别;
80、90年代语音处理技术产品化—IBM Tangora-5和Tangora-20英语听写机,Dragon Dictate 词汇翻译系统(70000),汉语听写机;
近几年基于云计算技术的语音信号处理技术飞速发展;
国内,清华大学、中科院声学所和中科院自动化所在汉语听写机研究方面有一定成果;1.3 语音信号处理研究方向;;;;;;应用——点名系统;;;;;基本原理;客户需求:
预约挂号;;情感的种类;人类基本情感;应用——载人航天;非特定说话人;;键 盘;系统实例;EmotionTTS
在现在陈述语气合成的基础上实现感叹,疑问,强调的效果
在正常情绪合成的基础上增强系统在高兴,生气,悲伤等多种情绪方面的表现能力
;;应用——智能公交系统;应用——家庭安全警示系统;;应用——被动声定位器 ;应用——Humanoid Robot HRP-2 ICRA 2004;应用——助听器方向性麦克风技术;;演示;;;;
;
;场景分类;语音分离;如何学好语音信号处理这门课? ;第 2 章 语音信号处理基础知识;2.1 语音的产生与感知;肺的功能: ◆呼吸功能,进行气体交换
◆提供能量,将压缩空气供给发音器官
气管:连接肺和喉,是肺与声道联系的通道
喉:由软骨和肌肉组成的复杂系统,含声带(发音器官)
声带: ◆是阀门,又是振动部件
◆声带紧绷在喉头的前后壁上,有折叠
◆声带的长度约10 ~ 14 mm
声带的声学功能:为语音提供主要的激励源;空气作用:使声带开启/闭合,形成脉动气流(声门脉冲串)
基音周期(振动周期):声带每开启/闭合一次的时间
基音频率(基频):基音周期的倒数
基频随人性别、年龄而不同
基频:通常为50 ~ 450 Hz
◆男性一般为50 ~ 250 Hz
◆女性一般为200 ~ 450 Hz
老年男性偏低,小孩和青年女性偏高
基频高则音调高,基频低则音调低
基频与声带的大小、厚薄、松紧程度以及声门上下之间的气压差等有关;声道:从声门至口唇的所有发音器官
包括咽腔、口腔和鼻腔
成男声道:长17 cm/面积20 cm2
声道可看成非均匀截面的声管,
是时间函数。
口腔各器官协同动作,空气流通过时形成不同阻碍,并产生振颤,发出不同声音。
口腔是声道最重要的部分,其大小和形状可以通过调整舌、唇、齿和腭来改变。
咽腔与口腔使声道的形状变化增多,能发出较多的声音。
;在发音过程中,肺部与相连的
肌肉相当于声道系统的激励源
浊音:声带处于收紧状态时,
气流使声带振动产生的声音
清音:声带处于放松状态时,
不伴有声带振动产生的音
两种清音:摩擦音,爆破音
摩擦音:舌在声道的某处形成狭窄部位(收紧点)
气流经过时产生湍流形成噪声型的声音
爆破音:松懈声带,用舌和嘴唇关闭声道,暂时阻止气流。
气压升高,突然放开舌与嘴唇,气流释放产生短暂冲音
◆不同的声道收紧点和声道形状,形成不同的摩擦音
◆不同的声道闭紧点和声道形状,形成不同的爆破音;1)耳的结构
人的听觉系统。
◆组成:外耳、中耳和内耳。
◆外耳和中耳有导音的作用,
合称为导音系;
◆内耳有感音作用,称感音器。
其感音作用起始于蜗神经的终端(螺旋器),故内耳的淋巴系统也属于导音系。;外耳:由耳翼、外耳道和鼓膜组成。
◆耳翼:有保护耳孔和定向作用。
◆外耳道:是一条耳管,声音沿其传至鼓膜。
有许多共振频率,封闭时最低共振频率约为3060 Hz。
共振效应会使声音得到10 dB左右的放大。
◆鼓膜:位于外耳道内端的韧性锥形结构,
声音的振动通过鼓膜传到内耳。
日常谈话中,鼓膜位移约为10?8 cm。
外耳的作用:有对声源定位和声放大。
头部的衍射效应也会增大鼓膜处的声压
文档评论(0)