- 1、本文档共66页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第4章 语音识别特征(幻灯讲义)
第四章
语音识别特征
1. 语音信号的主要特点
1.1. 语音信号带宽
语音信号的带宽约为 5KHz ,主要能量集中在低频段。
1.2. 语音信号是典型的随机信号
1)人的每次发音过程都是一个随机过程。很难得到两次完
全相同的发音样本。
2 )在信号处理中,通常假设语音信号是短时平稳的。例如,
可以认为在语音的浊音段部分,语音的二阶矩统计量是平稳的
(在 5~10mS 内) ,即二阶矩平稳,或称为宽平稳。
1
2. 语音信号的时域波形
图4-1. 语音信号的波形(shi4 )
2
图4-2. 语音信号波形(shi4 )的局部细节
3
2.1. 语音时域信号特征
2.1.1. 语音时域信号的特点
1)清音段:能量低,过零率高,波形特点有点像随机的噪
声。这部分信号常与语音的辅音段对应。
2 )浊音段:能量高,过零率低,波形具有周期性特点。所
谓的短时平稳性质就是处于这个语音浊音(元音)段中。
3 )过渡段:一般是指从辅音段向元音段信号变化之间的部
分。信号变化快,是语音信号处理中最复杂、困难的部分。
4
2.1.2. 语音的短时能量、短时平均幅度和短时过零率
N −1
(1)短时能量: E S n(2 )
∑ w
n 0
N −1
(2 )短时平均幅度: M S n( )
∑ w
n 0
(3 )短时过零率:
N −1 ⎫
⎧
1 − ( 1)]n −
sgn[ZS (n)] sgn[S ⎬
2 ⎨∑ w w
n 0 ⎭
⎩
1 ⎧0 x ≥
其中
sgn[ ] n ⎨
−1 ⎩0 x
5
3. 语音信号的短时谱特征
3.1. 短时傅立叶谱分析
对于能量受限的时域信号 ,它的傅立叶变换可以写成
f t( )
∞
j −t ω
ˆ
f ( ) f t( )ω ∫ ⋅e
−∞
以上这个傅立叶变换,在“宏观上”给出信号 的频谱信息,
您可能关注的文档
- 第4章 紫外可见光谱.doc
- 第4章 网络路由设计 四级网络工程师PPT 课件.ppt
- 第4章 绘制基本图形元素(下) AutoCAD绘图简明教程(2008版) 教学课件.ppt
- 第4章 网页表格的处理 《网页制作宝典》教学课件.ppt
- 第4章 编辑路径与对象 CorelDRAW平面设计简明教程 教学课件.ppt
- 第4章 航空运输 物流运输与配送管理课件.ppt
- 第4章 调幅、检波与混频 高频电子线路(第3版) 电子教案.ppt
- 第4章 货币市场的均衡 宏观经济学原理与实务课件.ppt
- 第4章 计算机局域网 计算机网络实用知识 教学课件 ppt.ppt
- 第4章 食品质量法规 食品质量安全管理和监督 教学课件.ppt
最近下载
- 100以内加减法竖式练习题-两位数加减法竖式练习题A4直接打印.doc VIP
- 铁道供电技术职业生涯规划书.pptx VIP
- 会计职业生涯规划书5篇.pdf VIP
- 2024最新民事起诉状.doc VIP
- 3D工程图学(华中科大)中国大学MOOC慕课 章节测验 客观题答案.docx
- 血液透析患者护理查房课件.pdf VIP
- 初级消防设施操作员.docx VIP
- 北京市宣武区2024-2025学年六年级数学第一学期期末调研试题含解析.doc VIP
- 2024-2025学年英语三年级上册人教精通版(三起)(2024)教学设计(附教材目录).docx VIP
- 二年级语文上册-第七单元【教材解读】.pptx VIP
文档评论(0)