02语言信号处理第二章基础知识.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
02语言信号处理第二章基础知识

第二章 语音信号处理的基础知识;主要知识点:;2.1 概述;人类的语音是由人体发音器官在大脑控制下的生理运动产生的; 人的发音器官包括:肺、气管、喉、咽、鼻、口等。 ;人的发音器官简图 ;语音产生的机理图 ; 喉以上的部分称为声道,其形状随发出声音的不同而变化; 喉的部分称为声门。 喉部的声带是对发音影响很大的器官。声带振动产生声音。 声带开启和闭合使气流形成一系列脉冲。 每开启和闭合一次的时间即振动周期称为基音周期,其倒数为基音频率,简称基频。基频决定了声音频率的高低,频率快则音调高,频率慢则音调低。 基音的范围约为70 -- 350Hz,与说话人的性别、年龄等情况有关。; 语音由声带振动或不经声带振动来产生,其中: 由声带振动产生的音称为浊音(Voice Speech); 不由声带振动产生的音称为清音(Unvoice Speech);(a) 清音 (b)浊音 (c)爆破音; 声道可以等效为一个谐振腔,在发音时起共鸣作用 当元音激励进入声道时会引起共鸣,产生的一组谐振频率 这就称共振峰频率或简称共振峰。 共振峰是区别不同元音的重要参数 谐振频率由每一瞬间的声道外形来决定。 若声道截面是均匀的,则谐振频率发生在:; ;语音产生的两个重要参数;2.3 语音信号特性 ;语音的声学特性 音色:音质,区别不同声音的基本特征 音调:声音的高低; 音量:声音的幅度强弱; 音长:声音的发音时间长短。;语音学基础知识 音素是语音的基本单位。可以分为元音和辅音。 元音是指发音的过程中,对声腔气流无明显阻塞而发出的音段,如[a]、[i]等。 辅音是声腔气流明显受阻时所发出的音段,如[m][n]等。 此外还用半元音、双元音、半辅音等等。 美国英语包括42个音素,分为:元音12个;双元音6个;半元音4个;辅音20个。; 汉语普通话是以北京语音为标准音 汉语音素主要由声母和韵母组成 汉语采用声韵结构,每个字音分成两部分,前面的部分称为声母(initial),后一部分称为韵母。 声母为辅音,但不是所有的辅音都可以做声母。声母共22个。;声母表 b p m f d t n l g k h j q x zh ch sh r z c s 韵母可以包括一个元音,也可以包括多个元音,也可以包括辅音。韵母共38个。 韵母表 I u ü A ia ua o uo e ie üe ai uai ei uei ao iao ou iou an ian uan üan en in uen ün ang iang uang eng ing ueng ong iong ;汉语音素为64个,分为辅音、单元音、复元音和复鼻尾音。 汉语的每个字就是一个音节。音节由声母和韵母拼接而成,音节中也可以不包含声母。 无调音节415个。 每个音节可以有四种声调,因此有调音节一千二百多个。 ;汉语音节的声调主要体现在信号的基音频率随时间而变的规律上。;注意:;二、语音的时间波形和频谱特性;;2. 声门激励脉冲的频域特性;3. 输出的语音频谱;4. 语音信号特性;图2-8 元音【∧】的频谱;图2-9 辅音【S】的语谱; 声门脉冲 声道 语音信号;人的听觉系统 是一个十分巧妙的音频信号处理器 听觉系统对声音信号的处理能力来自于它巧妙的生理结构;; 人的耳朵接收声音并转换成神经刺激。人耳听到声音后,还要经过大脑处理变成确定的含义,这就是对语音的感知。;耳蜗就像一个频谱分析仪,将复杂的信号分解成各种频率分量 人耳能听到的频率范围大约为16Hz~16kHz,年轻人上限频率可达20kHz,老年人则衰退为10kHz。强度大概为-5~130dB ;对于人耳的感觉,用声音三要素来描述: 响度:人耳对声音强弱程度的反映。取决于声音的幅度,并和频率有关。如:对3000~4000Hz最敏感。 音调:也叫音高。人耳对声音频率高低的感受。如:对频率高的声音感觉音调“高”,对频率低的声音感觉音调“低”。 音色:也叫音质。反映了声音属性。每个声音具有特殊的音色。 ;人听觉系统重要特性——掩蔽效应;掩蔽效应分为同时掩蔽和短时掩蔽;异时掩蔽又分为前掩蔽和后掩蔽两种 一般后掩蔽可持续100 ms,而前掩蔽仅持续20 ms。 ;各种不同的掩蔽效果 (1)纯音调信号间的掩蔽 ;(2)宽带噪声对纯音调的掩蔽 ;(3)窄带噪声对纯音调的掩蔽 ; 中心频率不同的窄带噪声产生的掩蔽阈值曲线

文档评论(0)

cbf96793 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档