6说话人识别.pptVIP

  • 31
  • 0
  • 约4.62千字
  • 约 41页
  • 2017-08-25 发布于河南
  • 举报
Ⅴ说话人识别 Ⅴ说话人识别(1) 说话人识别(Speaker Recognition): 又称为话者识别,是指通过对说话人语音信号的分析处理,自动确认说话人是否在所记录的话者集合中,以及进一步确认说话人是谁。 为什么能识别说话人? 人与人间在发音器官上存在着差异,例如在声带和声管形状上的差异; 讲话时发音习惯的差异,包括方言、土语、抑扬顿挫、常用词汇及讲话上的怪僻语等; 说话人特点以复杂的形式反映在其语音波形中。使得每个人的语音都带有强烈的个人色彩。 Ⅴ说话人识别(2) 说话人识别的分类 按其识别任务分: 说话人辨认(Speaker Identification ) 判断某段语音是若干人中的哪一个人所说,是“多选一”问题。又可分为开集和闭集两种。 说话人确认(Speaker Verification ) 确定某段语音是否是指定的某个人所说,是“一对一”的判别问题。 说话人分割和标注(Speaker Segmentation and Labeling) 将多个说话人的数据分割标定为独立的部分。 Ⅴ说话人识别(3) Ⅴ说话人识别(4) Ⅴ说话人识别(5) 根据识别对象的不同,还可将说话人识别分为三类: 与文本有关(Text-Dependent) 与文本无关(Text-Independent) 文本提示型(Text-Prompted) Ⅴ说话人识别(6) 说话人识别技术有着广阔的应用前景 电话信道罪犯缉拿、法庭中电话录音信息的身份确认、电话语音跟踪,为用户提供防盗门开启功能等等。 通信领域,说话人识别技术可以应用于诸如电话银行、电话购物、数据库访问、信息服务、安全控制、计算机远程登陆等领域。 呼叫中心应用上,说话人识别技术同样可以提供更加个性化的人机交互界面。 Ⅴ说话人识别(7) 说话人识别的基本原理 Ⅴ说话人识别(8) 几个问题 1)语音信号的预处理和特征提取。即提取能够有效表征说话人特征的参数。 2)说话人模型的建立和模型参数的训练。 3)测试语音与说话人模型的匹配计算。 4)识别与判决策略。即根据匹配计算的结果,采用某种判决准则判定说话人是否是所声称的说话人(说话人确认)或说话人到底是谁(说话人辨认)。 Ⅴ说话人识别(9) 性能的评价 评价说话人识别系统性能的指标有很多,例如系统的识别率,训练时间的长短和训练语料的数量、识别响应时间、话者集规模、说话方式要求以及价格等 。 比如说,声控门锁识别响应时间要求很严格,但可获得充足的训练语料。司法鉴定,对识别响应时间的要求可以相对放松,但训练数据的充足性无法保证。 说话人辨认系统常用的是识别率,以及错误率(误识率)。 Ⅴ说话人识别(10) 说话人确认系统,则常用两个错误率来表示:错误拒识率(False rejection,简称FR),错误接受率(False acceptance,简称FA)。 Ⅴ说话人识别(11) Ⅴ说话人识别(12) Ⅴ说话人识别(13) Ⅴ说话人识别(14) Ⅴ说话人识别(15) Ⅴ说话人识别(16) Ⅴ说话人识别(17) Ⅴ说话人识别(18) Ⅴ说话人识别(19) 与文本无关的识别方法 传统的有:基于VQ的方法;基于HMM的方法;基于人工神经网络的方法,以及基于语音识别的方法等。 基于VQ的方法 把每个待识别说话人的语音看作一个信号源,用一个码本来表征,码本是从该说话人的训练语音序列中提取的特征矢量聚类而成。 对于N个人的系统,就需建立N个码本。 Ⅴ说话人识别(23) 近年来,高斯混合模型(Gaussian Mixture Model,简称GMM)的方法受到了研究者的普遍重视。 它的数学模型实质上对应于一个状态的连续HMM。 但它不像HMM那样通过状态转移概率约束声学特征类的时序变化,所以GMM比HMM的计算量要小得多。 Ⅴ说话人识别(24) Ⅴ说话人识别(25) Ⅴ说话人识别(26) Ⅴ说话人识别(27) Ⅴ说话人识别(28) Ⅴ说话人识别(29) Ⅴ说话人识别(30) Ⅴ说话人识别(31) Ⅴ说话人识别(34) Ⅴ说话人识别(35) Ⅴ说话人识别(36) Ⅴ说话人识别(37) Ⅴ说话人识别(38) Ⅴ说话人识别 说话人确认系统 GMM-UBM说话人确认系统 经典模型——GMM GMM的说话人鉴别(Speaker Identification)系统 UBM UBM——通用背景模型 UBM也是一个GMM,只是这个GMM需要用 大量的 不同说话人的语音数据经过训练来表 示说话 人无关的特征分布,这种特征是大多 数说话人的共性特征。 GMM-UBM 建模

文档评论(0)

1亿VIP精品文档

相关文档