- 10
- 0
- 约6.18千字
- 约 59页
- 2019-11-28 发布于广东
- 举报
4. 人耳刚刚可以听到的声音强度,称为“听阈”。 加大声音的强度,使听起来令耳朵感到疼痛,这个阈值称为“痛阈”。 5.音高(音调) 音高也叫基音。 物理单位为Hz,主观感觉的音高单位是美(Mel)。当声强级为40dB频率为1kHz时,设定的音高为1000美。 2.4.2 掩蔽效应 掩蔽效应: 两个响度不等的声音作用于人耳时,则响度较高的频率成分的存在会影响到对响度较低的频率成分的感受,使其变得不易察觉,即:一个声音的听觉感受性受同时存在的另外一个声音的影响,这个现象称为人耳的“掩蔽效应”。此时前者称为被掩蔽音,后者称为掩蔽音。在掩蔽情况下,被隐蔽音的听阈会提高,即加大被掩蔽音的强度才能听到。此时听阈称为掩蔽听阈。 低频的纯音可以有效地掩蔽高频的纯音。 利用人耳的掩蔽效应,在进行语音压缩时,让量化噪音的频谱跟随语言信号频谱包络变化。则共振峰的频率成分就会掩蔽掉量化噪声。这个技术称为噪声整形或听觉加权处理。 低音容易掩蔽高音,而高音掩蔽低音较难。 基于此,可以将真实的声音频率映射到“感知”频率尺度,即Bark尺度对应的临界带宽。 2.4.3 临界带宽与频率群 用一中心频率为f,带宽为Δf的白噪声来掩蔽一频率为f的纯音,先将这个白噪声的强度调节到使被掩蔽纯音恰好听不见为止。然后将Δf由大到小逐渐变化,而保持单位频率的噪声强度(即噪声谱密度)不变,起初这个纯音一直是听不见的,但当Δf小到某个临界值时,这个纯音就突然可以听见了。如果再进一步减小Δf,被掩蔽音f就会越来越清晰。这里刚刚开始能听到被掩蔽声时的Δf宽的频带,叫做频率f处的临界带。 当掩蔽噪声的带宽窄于临界带的带宽时,能掩蔽住纯音f的强度是随噪声的带宽的增加而增加的,但当掩蔽噪声的带宽达到临界带后,继续增加噪声带宽就不再引起掩蔽量的提高了。临界带宽是随中心频率而变的,被掩蔽纯音的频率(即临界带的中心频率)越高,临界带宽也越宽。 临界频带也可定义为:一个给定的正弦纯音在基底膜上能够产生谐振反应的那一部分。一个频率群的划分相应于基底膜分成许多很小的部分,每一部分对应一个频率群。 一个临界带的单位用巴克(Bark)表示。 2.5 语音信号模型 有三部分作用施加在语音的声波上: 声门产生的激励模型G(z); 声道产生的调制函数V(z); 嘴唇产生的辐射函数R(z)。 语音信号的传递函数由这三个函数级联而成, 即:H(z)=G(z)V(z)R(z) 2.5.1 激励模型 ? 发浊音时,产生的脉冲类似于斜三角形的脉冲。激励波是一个以基音周期为周期的斜三角脉冲串。 ? 图2.9 三角波及其频谱图 单个三角波的数学表达式为 其中:N1为斜三角波的上升时间 N2为其下降时间 单个斜三角波的频谱G(ejω)表现出一个低通滤波器的特性。其z变换的全极点形式为: 作为激励的斜三角波串可以用一串加了权的单位脉冲序列去激励单位斜三角波模型实现。这个单位脉冲串和幅值因子可以表示成下面的z变换形式 浊音激励模型可表示为 清音可以模拟成随机白噪声。 2.5.2 声道模型-(1)共振峰模型 典型的声道模型有两种:无损声管模型和共振峰模型。 (1)共振峰模型 当声波通过声道时,受到声腔共振的影响,在某些频率附近形成谐振。反映在信号频谱图上,在谐振频率处其谱线包络产生峰值,一般把它叫作共振峰。 实践表明,用前三个共振峰代表一个元音足够了。多个Vi叠加可以得到声道的共振峰模型: 一个二阶谐振器的传输函数可以写成 无损声管模型:是假定声道由多个等长的不同截面积的管子串联而成的系统,并假定管子中的流体及管壁没有热传导和粘滞的损耗。在短时间内,声道可表为形状稳定的管道,并可以认为声波是沿管轴传播的平面波。 2.5.2 声道模型-(2)无损声管模型 对于N个无损声管级联的情况,可得到无损声管的传递函数为: 从声道模型输出的是速度波ul (n),而语音信号是声压波Pl(n)。二者倒比称为辐射阻抗Zl,它表征口唇的辐射效应。如果认为口唇张开的面积远远小于头部的表面积,利用单板开槽辐射的处理方法,可以得到辐射阻抗,r近似为1 2.5.2 声道模型-(3)辐射模型 由辐射引起的能量损耗正比于辐射阻抗的实部R(z),其频响曲线表现出一阶高通滤波器的
原创力文档

文档评论(0)