- 11
- 0
- 约1.91千字
- 约 3页
- 2017-06-07 发布于重庆
- 举报
HTK学习笔记
由语音数据得到观察向量的过程,称为语音信号处理。(信号处理)
语音信号处理大多包含时域到频域的转换,例如FFT。
处理结果可能包含多种因素,共同组成观察向量。
观察向量的概率分布,是多元混合正态分布,应使用多元混合高斯函数描述观察概率。
转移概率是?分布,应使用?模型描述。
使用多个样本对概率模型参数进行最大似然估计。(概率论)
参数估计过程是一个迭代的过程,叫做前向/后向算法。
可以将多个HMM联合成一个较大的HMM,同时对这些HMM进行参数估计。
参数估计收敛到一定程度时停止。
孤立词识别通过计算每个HMM的概率完成。
连续语音识别是一个路径空间搜索过程,具有最大概率加权的路径,就是当前结果。
需要使用任务语法构造这个路径空间。(人工智能)
一、语音信号处理
1、预处理
清除DC均值(ZMEANSOURCE T)
有时AD转换时会给数字信号添加一个DC偏移,可以去掉。
信号预加重(PREEMCOEF 0.9)
HTK中使用差分进行信号预加重,系数可调。
采样细化(Taper)(USEHAMMING T)
减弱哈明窗口边缘的信号不连续性。
添加噪声(ADDDITHER q)
防止某些采样数据编码会数值溢出。
如果需要可以调整采样数据字节序
2、信号处理
1)哈明窗口大小一般大于参数采样周期,即生成各Observation的采样数据是部分重叠的。
2)一个Observation最多
您可能关注的文档
- Fireworks常用操作技巧总结.docx
- flash8.0引导路径动画详解及实例.doc
- FM1009限用物质承诺书.doc
- ESDEOS参考资料-Rev1.doc
- FMC制作工艺.doc
- FreeKaoYan人文地理学王恩涌最后总结.doc
- FSC参考资料.doc
- Foxmail作为邮件恢复修复使用图文教程.doc
- FreeNAS学习笔记(修订).docx
- FreeNAS学习笔记.doc
- 2026年山东省滨州市惠民县中考化学一模试卷(含答案).pdf
- 2026年山东省济南市历城区中考化学二模试卷(含答案).pdf
- 2026年山东省烟台市福山区中考化学模拟试卷(含答案).pdf
- 2026年山东省临沂市郯城县中考化学一模(含答案).pdf
- 2026年四川省德阳市中江县中考化学二诊试卷(含答案).pdf
- 2026年四川省绵阳市梓潼县中考化学二模试卷(含答案).pdf
- 2026年新疆乌鲁木齐市沙依巴克区中考化学适应性试卷(含答案).pdf
- 2026年重庆市永川区中考化学质检试卷(含答案).pdf
- 2026年重庆市第一中学校中考化学全真模拟试卷(二)(含答案).pdf
- 安徽池州市第二中学等校2025-2026学年高一下学期期中物理试卷A(含答案).pdf
最近下载
- SIMICAS智能网关 网关 9DE5 156-7FB03-0EA0 用户手册.pdf
- 《JTT 1375.3-2024公路水运工程施工安全风险评估指南 第3部分:隧道工程》专题研究报告.pptx VIP
- 水电安装合同电子版 .pdf VIP
- 儿童功能性腹痛诊疗临床应用专家共识.docx
- 2026届贵州省铜仁地区名校中考适应性考试生物试题含解析.doc VIP
- (最新)26年人教版八年级英语下册Unit7第6课时(Section B 3a-3c).pptx
- 2025年广东省惠州市中考化学试题卷(含答案解析).docx
- 四川省自然资源投资集团有限责任公司2026年上半年公开招聘笔试参考题库及答案解析.docx VIP
- 部编版四年级《语文》下册第27课《巨人的花园》优质课件.pptx
- QJHJC 00 1021-2019 先张法预应力混凝土波浪桩.pdf VIP
原创力文档

文档评论(0)