- 3
- 0
- 约3.43千字
- 约 35页
- 2016-07-31 发布于湖北
- 举报
10.1概述
10.2说话人识别方法和系统结构
10.3应用DTW的说话人确认系统
10.4应用VQ的说话人识别系统
10.5应用HMM的说话人识别系统
;10.1 概述;10.2 说话人识别方法和系统结构;10.2.1预处理
包括对输入计算机的语音数据进行端点检测、预加重、加窗、分针等。
10.2.2说话人识别特征的选取
在说话人识别系统中特征提取是最重要的一环,特征提取就是从说话人的语音信号中提取出表示说话人个性的基本特征。
在理想情况下,选取的特征应当满足下述准则:
能够有效地区分不同的说话人,但又能在同一说话人的语音发生变化时相对保持稳定。
易于从语音信号中提取
不易被模仿
尽量不随时间和空间变化;如果把说话人识别中常用的参数加以简要归类,可划分为以下几类:
线性预测参数及其派生参数
语音频谱直接导出的参数
混合参数
其他鲁棒性参数
上表是日本人Matui和Furui在1990年针对倒谱特征和基音特征所作的比较实验结果;10.2.3特征参量评估方法
F比:在给定一种识别方法后,识别的效果主要取决于特征参数的选取。对于某一维单个的参数而言,可以用F来表征它在说话人识别中的有效性。
F越大表示越有效,即不同说话人的特征量的均值分布的离散程度分布得越散越好;而同一个人的越集中越好。;10.2.3特征参量评估方法
;10.2.4模式匹配
原创力文档

文档评论(0)