HTK学习笔记.docVIP

  • 11
  • 0
  • 约1.91千字
  • 约 3页
  • 2017-06-07 发布于重庆
  • 举报
HTK学习笔记

由语音数据得到观察向量的过程,称为语音信号处理。(信号处理) 语音信号处理大多包含时域到频域的转换,例如FFT。 处理结果可能包含多种因素,共同组成观察向量。 观察向量的概率分布,是多元混合正态分布,应使用多元混合高斯函数描述观察概率。 转移概率是?分布,应使用?模型描述。 使用多个样本对概率模型参数进行最大似然估计。(概率论) 参数估计过程是一个迭代的过程,叫做前向/后向算法。 可以将多个HMM联合成一个较大的HMM,同时对这些HMM进行参数估计。 参数估计收敛到一定程度时停止。 孤立词识别通过计算每个HMM的概率完成。 连续语音识别是一个路径空间搜索过程,具有最大概率加权的路径,就是当前结果。 需要使用任务语法构造这个路径空间。(人工智能) 一、语音信号处理 1、预处理 清除DC均值(ZMEANSOURCE T) 有时AD转换时会给数字信号添加一个DC偏移,可以去掉。 信号预加重(PREEMCOEF 0.9) HTK中使用差分进行信号预加重,系数可调。 采样细化(Taper)(USEHAMMING T) 减弱哈明窗口边缘的信号不连续性。 添加噪声(ADDDITHER q) 防止某些采样数据编码会数值溢出。 如果需要可以调整采样数据字节序 2、信号处理 1)哈明窗口大小一般大于参数采样周期,即生成各Observation的采样数据是部分重叠的。 2)一个Observation最多

文档评论(0)

1亿VIP精品文档

相关文档