- 6
- 0
- 约1.58千字
- 约 15页
- 2017-05-13 发布于湖北
- 举报
声音识别基础知识 2015级电子与通信工程 董雪 声音识别原理 语音输入 训练 识别 结果 声音识别的过程 声音的预处理:振幅归一化、预加重、样本分割、加窗 特征提取:特征参数可以是能量、基音频率、共振峰值等,较常见的是线性预测倒谱系数LPCC、Mel倒谱系数MFCC。二者均为将声音信号变换到倒谱域上。 幅值归一化 幅值归一化就是把每一个采样值除以本段信号的幅值。即: 其中, 是原始信号, 是归一化后的信号,n是信号长度。 预加重处理 目的:对高频部分进行加重,增加语音的高频分辨率。 实现方式:一般通过传递函数 的一阶FIR高通数字滤波器来实 现预加重,其中, 为预加重系 数,其值介于0.9到1.0之间。 加窗处理 预加重处理后,进行加窗分帧处理。 原理:由于发声器官的惯性运动,可以认为在一小段时间内(一般为10~30ms)语音信号近似不变,即语音信号具有平稳性。这样,可以把语音信号分为一些短段(分析帧)。语音信号的分帧是采用可移动的有限长度窗口进行加权的方法实现。一般每秒33~100帧。 加窗处理 虽采用连续分段,但一般采用交叠分段 的方法使帧与帧之间平滑过渡,保持连
您可能关注的文档
最近下载
- 电商物流服务满意度影响因素分析.docx VIP
- (高清版)B-T 22301-2021 干迷迭香.pdf VIP
- 国开《计算机应用基础》学士学位论文的格式设置.docx VIP
- 九年级化学燃烧与灭火省公开课一等奖全国示范课微课金奖课件.pptx VIP
- 逆向操作、快速编制理正勘察数据库选编.doc
- 人教版八年级物理下册《第十章浮力》单元测试卷(含答案).docx VIP
- 人教版八年级物理下册-第十章《浮力》单元测试卷(含答案) .pdf VIP
- 固模剪力墙结构技术规程.pdf VIP
- Call of Silence-钢琴谱 原调简谱 高清正版完整版双手简谱.pdf
- 300td生活垃圾焚烧烟气净化工艺设计.docx VIP
原创力文档

文档评论(0)