(语音信号处理课件)14说话人识别.pptVIP

  • 2
  • 0
  • 约1.04万字
  • 约 80页
  • 2018-06-22 发布于贵州
  • 举报
(语音信号处理课件)14说话人识别

说话人识别 说话人识别所用特征: 说话人识别的几种方法 1.模板匹配法 模板匹配法的要点是:在训练过程中从每个说话人发出的训练语句中提取相应的特征矢量,这些特征矢量能充分描写各个说话人的行为。这些特征矢量称为各说话人的模板。 它们可以从单词,数字串或句子中提取。在测试阶段,从说话人发出的语音信号中按同样的处理方法提取测试模板,并且与其相应的参考模板相比较。 常用的有动态时间规整和矢量量化方法。 2. 概率统计方法 语音中说话人信息在短时内较为平稳,通过对稳态特征如基音、声门增益、低阶反射系数的统计分析,可以利用均值、方差等统计量和概率密度函数进行分类判决。其优点是不用对特征参量在时域上进行规整,比较适合文本无关的说话人识别。 常用的有隐马尔可夫模型和高斯混合模型。 隐马尔可夫模型是一种基于转移概率和传输概率的随机模型,最早在CMU和IBM被用于语音识别。 它把语音看成由可观察到的符号序列组成的随机过程,符号序列则是发声系统状态序列的输出。 在使用HMM识别时,为每个说话人建立发声模型,通过训练得到状态转移概率矩阵和符号输出概率矩阵。 识别时计算未知语音在状态转移过程中的最大概率,根据最大概率对应的模型进行判决。 HMM不需要时间规整,可节约判决时的计算时间和存储量,在目前被广泛应用。缺点是训练时计算量较大。 6 粒子群优化小波神经网络说话人识别

文档评论(0)

1亿VIP精品文档

相关文档