HTK学习笔记.docVIP

下载本文档

11
0
约1.91千字
约 3页
2017-06-07 发布于重庆
举报

HTK学习笔记.doc

HTK学习笔记

由语音数据得到观察向量的过程，称为语音信号处理。（信号处理）语音信号处理大多包含时域到频域的转换，例如FFT。处理结果可能包含多种因素，共同组成观察向量。观察向量的概率分布，是多元混合正态分布，应使用多元混合高斯函数描述观察概率。转移概率是？分布，应使用？模型描述。使用多个样本对概率模型参数进行最大似然估计。（概率论）参数估计过程是一个迭代的过程，叫做前向/后向算法。可以将多个HMM联合成一个较大的HMM，同时对这些HMM进行参数估计。参数估计收敛到一定程度时停止。孤立词识别通过计算每个HMM的概率完成。连续语音识别是一个路径空间搜索过程，具有最大概率加权的路径，就是当前结果。需要使用任务语法构造这个路径空间。（人工智能）一、语音信号处理 1、预处理清除DC均值（ZMEANSOURCE T）有时AD转换时会给数字信号添加一个DC偏移，可以去掉。信号预加重（PREEMCOEF 0.9） HTK中使用差分进行信号预加重，系数可调。采样细化（Taper）（USEHAMMING T）减弱哈明窗口边缘的信号不连续性。添加噪声（ADDDITHER q）防止某些采样数据编码会数值溢出。如果需要可以调整采样数据字节序 2、信号处理 1）哈明窗口大小一般大于参数采样周期，即生成各Observation的采样数据是部分重叠的。 2）一个Observation最多

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

HTK学习笔记.docVIP