- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 时域波形 直观的特征 周期性 摩擦 停顿 时长 幅度 波形解释-发音方式 清/浊 摩擦 塞 送气 鼻 显著程度 频域特征-samples 频域特征 直观的特征 包络 细节 频域特征-发音部位 周期性 共振峰位置 能量集中区 能量 语谱图 需求:综合显示 发音方式-时域 发音部位-频域 语谱图:语音频谱随时间变化的图形 横轴:时间 纵轴:频率 灰度:能量大小 语谱图-samples 宽带-300Hz 窄带-45Hz 语谱图 典型特征 横杠 冲直条 乱纹 最为经典的语音分析显示手段 实现手段 Bell Lab. in 40’s, 模拟滤波器组 Kay Inc. in 80’s,基于DSP的数字滤波器组 Speech analysis tools praat, free, professional tools SFS, free, professional tools Cooledit, popular tools 第二章 语音信号的声学基础及产生模型 语音学 语音产生过程 语音信号的特性分析 语音感知 语音产生数学模型 语音感知 听觉器官(声学特征) 感知效应 语音感知 听觉器官(声学特征) 音质、音强、音高、音长 感知效应 感知效应 听阈 主观响度 主观音高 言语的选择性感知 感知效应 听阈 频率范围20~20kHz 声强0~120dB(0dB eq. 20uPa) 主观响度 主观音高 言语的选择性感知 主观响度 响度级(Loudness Level), Phon数值上等于1kHz纯音的声强级 响度(Loudness), 1Sone等于1kHz纯音t听阈之上40dB的响度 P=33.33lgS+40 3~5kHz频段最为灵敏 主观音高 美(Mel) 1kHz纯音定为1000Mel 听感上为1000Mel的n倍,nx1000Mel 临界带宽(Critical Band) 相同功率的噪声对纯音的屏蔽,噪声的频带宽度 20~16kHz,划为24个Bark Mel与频率的关系 言语的选择性感知 “鸡尾酒会效应” 发音的改变 选择性感知 感知过程 非线性处理过程 自下而上(数据驱动)+从上而下(知识驱动) 第二章 语音信号的声学基础及产生模型 语音学 语音产生过程 语音信号的特性分析 语音感知 语音产生数学模型 语音产生数学模型 产生模型 激励 声道 辐射 语音产生模型 源-滤波-辐射模型 冲激序列发生器 声门波模型 声道 模型 信号辐射模型 随机噪声发生器 激励模型 清音 随机白噪声 均值为0,方差为1的随机序列 浊音 右斜类三角波 斜三角波模型 Rosenberg声门波模型 Tp Tn T0 Tp Tn T0 斜三角波 Rosenberg声门波 激励模型 右斜类三角波的Z变换 G(z) 声道模型 声管模型 共振峰模型 声管模型 管子串联 管子对应于四端网络 反射系数与线性预测的参数相对应(Km对应于线性预测的反射系数)。 声门 唇 1 3 2 4 共振峰模型 级联型 并联型 混合型 级联型 元音 串联二阶谐振器 全极点模型(Autoregressive) db Hz a b c x(n) y(n) H1 H2 HM 并联型 辅音和其它元音 并联二阶谐振器 零极点模型 H1 H2 HM + 混合型 所有音素 H1 H2 HM H1 H2 HM + 辐射模型 口唇的辐射效应:声道内是体速度,空气中是声压。后者是前者的微分(+6dB/Oct.)。 本章小结 语音学 语音产生过程 语音信号的特性分析 语音感知 语音产生数学模型 * * * * * 第二章 语音信号的声学基础及产生模型 语音学 语音产生过程 语音信号的特性分析 语音感知 语音产生数学模型 语音学 界定 三个分支 基础知识 语音学 界定 语音学是研究人类说话声音的科学 三个分支 基础知识 语音学 界定 三个分支(发音-传递-感知) 发音语音学 也称生理语音学,研究发音器官在发音阶段的生理特性,确定发音部位和发音方式 声学语音学 研究语音在传递阶段的声学特性,用声学和现代信号分析理论来解释各种语音现象 感知语音学 研究语音感知阶段的生理和心理特性,也就是研究耳朵是怎样听音的,大脑是怎样解释这些声音的,语言信息在大脑中的存储部位和形式 基础知识 语音学 界定 三个分支 基础知识 基本声学特征 层级结构 辅音 元音 音节结构 基本声学特征 音质 响度 音高 音长 音段特征,音质 超音段特征,音高、响度、音长 层级结构 由下而上(bottom-
您可能关注的文档
最近下载
- 防腐、保温施工方案.docx VIP
- (完整版)沟槽开挖及支护专项施工方案(深基坑专家论证).doc
- 4.1 水循环(教案)2023-2024学年湘教版(2019)高中地理必修一.docx VIP
- EIM Book 1 Unit 1 Free time单元检测试题.pdf VIP
- 金风1.5MW型风机变流器断路器反馈丢失故障作业指导书.docx VIP
- 信息与通信技术产品供应链安全测试方法.docx VIP
- 高中必备成语及解释800个.docx VIP
- 公差配合与测量技术 第2版 项目三 千分尺与指示表的测量操作.pptx VIP
- 金风1.5MW型风机主控柜断路器状态反馈丢失故障作业指导书.docx VIP
- 第2课学会沟通交流(教学课件) 道德与法治统编版五年级上册.ppt
文档评论(0)