6说话人识别.pptVIP

下载本文档

31
0
约4.62千字
约 41页
2017-08-25 发布于河南
举报

6说话人识别.ppt

Ⅴ说话人识别 Ⅴ说话人识别（1）说话人识别（Speaker Recognition）：又称为话者识别，是指通过对说话人语音信号的分析处理，自动确认说话人是否在所记录的话者集合中，以及进一步确认说话人是谁。为什么能识别说话人？人与人间在发音器官上存在着差异，例如在声带和声管形状上的差异；讲话时发音习惯的差异，包括方言、土语、抑扬顿挫、常用词汇及讲话上的怪僻语等；说话人特点以复杂的形式反映在其语音波形中。使得每个人的语音都带有强烈的个人色彩。 Ⅴ说话人识别（2）说话人识别的分类按其识别任务分: 说话人辨认（Speaker Identification ）判断某段语音是若干人中的哪一个人所说，是“多选一”问题。又可分为开集和闭集两种。说话人确认（Speaker Verification ）确定某段语音是否是指定的某个人所说，是“一对一”的判别问题。说话人分割和标注（Speaker Segmentation and Labeling）将多个说话人的数据分割标定为独立的部分。 Ⅴ说话人识别（3） Ⅴ说话人识别（4） Ⅴ说话人识别（5）根据识别对象的不同，还可将说话人识别分为三类：与文本有关(Text-Dependent) 与文本无关(Text-Independent) 文本提示型(Text-Prompted) Ⅴ说话人识别（6）说话人识别技术有着广阔的应用前景电话信道罪犯缉拿、法庭中电话录音信息的身份确认、电话语音跟踪，为用户提供防盗门开启功能等等。通信领域，说话人识别技术可以应用于诸如电话银行、电话购物、数据库访问、信息服务、安全控制、计算机远程登陆等领域。呼叫中心应用上，说话人识别技术同样可以提供更加个性化的人机交互界面。 Ⅴ说话人识别（7）说话人识别的基本原理 Ⅴ说话人识别（8）几个问题 1）语音信号的预处理和特征提取。即提取能够有效表征说话人特征的参数。 2）说话人模型的建立和模型参数的训练。 3）测试语音与说话人模型的匹配计算。 4）识别与判决策略。即根据匹配计算的结果，采用某种判决准则判定说话人是否是所声称的说话人（说话人确认）或说话人到底是谁（说话人辨认）。 Ⅴ说话人识别（9）性能的评价评价说话人识别系统性能的指标有很多，例如系统的识别率，训练时间的长短和训练语料的数量、识别响应时间、话者集规模、说话方式要求以及价格等。比如说，声控门锁识别响应时间要求很严格，但可获得充足的训练语料。司法鉴定，对识别响应时间的要求可以相对放松，但训练数据的充足性无法保证。说话人辨认系统常用的是识别率，以及错误率（误识率）。 Ⅴ说话人识别（10）说话人确认系统，则常用两个错误率来表示：错误拒识率(False rejection，简称FR)，错误接受率(False acceptance，简称FA)。 Ⅴ说话人识别（11） Ⅴ说话人识别（12） Ⅴ说话人识别（13） Ⅴ说话人识别（14） Ⅴ说话人识别（15） Ⅴ说话人识别（16） Ⅴ说话人识别（17） Ⅴ说话人识别（18） Ⅴ说话人识别（19）与文本无关的识别方法传统的有：基于VQ的方法；基于HMM的方法；基于人工神经网络的方法，以及基于语音识别的方法等。基于VQ的方法把每个待识别说话人的语音看作一个信号源，用一个码本来表征，码本是从该说话人的训练语音序列中提取的特征矢量聚类而成。对于N个人的系统，就需建立N个码本。 Ⅴ说话人识别（23）近年来，高斯混合模型（Gaussian Mixture Model，简称GMM）的方法受到了研究者的普遍重视。它的数学模型实质上对应于一个状态的连续HMM。但它不像HMM那样通过状态转移概率约束声学特征类的时序变化，所以GMM比HMM的计算量要小得多。 Ⅴ说话人识别（24） Ⅴ说话人识别（25） Ⅴ说话人识别（26） Ⅴ说话人识别（27） Ⅴ说话人识别（28） Ⅴ说话人识别（29） Ⅴ说话人识别（30） Ⅴ说话人识别（31） Ⅴ说话人识别（34） Ⅴ说话人识别（35） Ⅴ说话人识别（36） Ⅴ说话人识别（37） Ⅴ说话人识别（38） Ⅴ说话人识别说话人确认系统 GMM-UBM说话人确认系统经典模型——GMM GMM的说话人鉴别(Speaker Identification)系统 UBM UBM——通用背景模型 UBM也是一个GMM，只是这个GMM需要用大量的不同说话人的语音数据经过训练来表示说话人无关的特征分布，这种特征是大多数说话人的共性特征。 GMM-UBM 建模

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

6说话人识别.pptVIP