声码器半解码参数用于说话人身份确认.PDF

声码器半解码参数用于说话人身份确认.PDF

第3 5 卷第4 期 中 国 科  学  技  术  大  学  学  报 Vol . 35 ,No . 4 2 0 0 5 年 8 月 JOURNAL OF UNIVERSITY OF SCIENCE AND TECHNOLOGY OF CHINA A ug . 2 0 0 5 ( ) 文章编号 2005 声码器半解码参数用于说话人身份确认 李晓先 ,戴蓓蒨 ,李  辉 ( 中国科学技术大学电子科学与技术系 ,安徽合肥 230026) 摘要 :面向通信领域广泛使用的线性预测声码器 ,设计了一种不经过“解码 - 特征 提取”过程 ,而直接由传输码流截取说话人特征的方法 ,并针对宽带 自适应多码率 ( ) 声码器 A M RWB 建立了与文本无关的话者确认系统. 系统采用基于概率统计模 型的GMMUBM结构 , 以L PC倒谱作为主要的话者特征矢量 ,并加入基音衍生参数 以提高确认性能. 实验表明 ,该系统在运算速度提高一个数量级的情况下 ,达到了 与基于重建语音的话者确认系统相接近的性能 ,且对码率失配具有 良好的鲁棒性. 关键词 :话者确认 ;半解码参数 ;基音频率 ; GMMUBM ;A M RWB 编码 中图分类号 : TN 9 12 . 34 文献标识码 :A 0  引言 说话人身份确认 ,也称声纹鉴别技术 ,具有使用方便 、资源丰富、设备简单等优点 ,在金 融 、商贸、公安 、军事等诸多领域有广阔的应用前景. 随着通信技术的发展 ,现实生活中越来 越多的语音数据以语音编码的形式存储 、传输. 因此 , 国际上已把面向编码语音 ,尤其是手机 编码语音的话者确认 ,作为说话人认证的研究重点之一[ 1~2 ] . 当前的主流通信系统 ,如 GSM 、CDMA 、IP 电话等 , 多使用基于线性预测的声码器. 对 于这类语音 ,话者确认常采用先解码恢复语音 ,再提取特征参数进行身份认证的方法[2 ] . 这 种方法便于利用现有的说话人确认系统 ,易于达到较高的识别率 ,但是 , 由于解码语音和特 征提取都要消耗较多的运算时间和存储空间 ,该方法不太适用于需要更高速度的话者确认 场合 ,如电信级的大范围说话人捕捉 ,也不太适合于低成本硬件实现. 根据线性预测声码器的特点 ,本文设计了一种从码流中直接截取说话人特征的方法 ,并 ( ) 针对宽带自适应语音编码 A M RWB 构建了一种与文本无关的话者确认系统. A M RWB 是 3 GP P 和 I TUT 共同的宽带语音编解码标准[3 ] , 由此构建的话者确认系统 , 既具有线性 预测声码器的代表性又有较高的实用价值. 本系统中的话者特征直接衍生 自声码器帧中的 通道和激励参数 ,因此系统有较高的运行速度. 实验表明 ,本文方法的话者确认性能与基于 解码语音的话者确认性能相近 ,且对 A M RWB 的码率失配情况有较好的鲁棒性. 收稿 日期 ( ) ( ) 基金项目: 国家自然科学基金 6027039 和安徽省自然科学基金 0 1042205 资助项 目. 作者简介 :李晓先 ,男 , 1978 年生 ,硕士生. 研究方向:研究说话人身份确认 ,语音编码. Email :xxli @ustc . edu 524 中国科学技术大学学报 第 35 卷 1  基于半解码参数的话者确认 1. 1  系统结构 在采用线性预测声码器的通信系统中 ,语音信号被分帧表示为若干声道和激励参数 ,

文档评论(0)

1亿VIP精品文档

相关文档