- 6
- 0
- 约5.39千字
- 约 35页
- 2016-06-08 发布于湖北
- 举报
从信源的建模来看,语音信号是一种典型的连续信源。所以语音信号可以用几种模型来建模: 无记忆模型 有记忆模型 离散模型 连续模型 这些模型可分为四类,如表10-2所示。 类型 记忆性 模型 离散 无记忆 VQ 有记忆 离散HMM 连续 无记忆 GMM 有记忆 连续HMM 基于失真的VQ方法 离散/连续各态经历HMM 基于VQ失真测度的方法是一种无记忆语音源模型,及独立时间序列源模型。 混合高斯分布模型 图10-12是一个具有三个混合函数的混合高斯分布模型和三状态各态历经连续HMM的例子。 语种辨别的应用领域 语种辨别在信息检索及军事领域都有很重要的应用。主要包括 多语种信息服务:很多信息查询中可提供多语种的服务,但一开始必须用多语种语言提示用户选择用户所需语言。 机器自动翻译的前端处理。 军事上对说话人身份和国籍进行判别或监听等。 10.1概述 10.2说话人识别方法和系统结构 10.3应用DTW的说话人确认系统 10.4应用VQ的说话人识别系统 10.5应用HMM的说话人识别系统 10.1 概述 自动说话人识别(Automatic Speaker Recognition 简称ASR),又称为话者识别或声纹识别,是一种自动识别说话人的过程。说话人识别和语音识别的区别在于,它不注重包含在语音信号内的文字符号以及语意内容信息,而是着眼于包
原创力文档

文档评论(0)