基于GMM的说话人识别算法研究及其在安卓平台的实现-计算机技术专业论文.docxVIP

  • 3
  • 0
  • 约5.31万字
  • 约 83页
  • 2019-01-04 发布于上海
  • 举报

基于GMM的说话人识别算法研究及其在安卓平台的实现-计算机技术专业论文.docx

基于GMM的说话人识别算法研究及其在安卓平台的实现-计算机技术专业论文

Classified Index: TN912.34 U.D.C: 004.93 Dissertation for the Master’s Degree of Engineering RESEARCH ON SPEAKER RECOGNITION ALGORITHM BASED ON GMM AND ITS APPLICATION TO THE ANDROID PLATFORM Candidate: Jianjun He Supervisor: Prof. Hongpeng Wang Asst. Supervisor: Senior Engineer Honghua Hu Academic Degree Applied for: Master of Engineering Specialty: Computer Technology Affiliation: Shenzhen Electric Appliance Company Date of Defence: December, 2012 Degree-Conferring-Institution: Harbin Institute of Technology 摘 要 说话人识别,也叫声纹识别,是通过对说话人语音信号的分析处理来完成说 话人的辨认或确认。随着嵌入式软硬件技术和无线通信领域的迅猛发展,语音输 入和控制将成为手持移动设备和嵌入式系统最佳的交互方式,以声纹信息为特征 的身份鉴别技术也越发显得重要。说话人识别技术研究的关键是语音信号的特征 提取、模型参数训练和识别等问题。本文通过研究基于声学特征的美尔倒谱特征 提取方法和基于概率统计的模式匹配方法,研 究实现了基于高斯混合模型 (Gaussian Mixture Model,简称 GMM)的说话人识别系统。 本文的研究重点是基于 TIMIT 语料库,分析研究了说话人识别的语音信号预 处理,以及说话人语音特征的提取原理和方法,并使用 Matlab 实现了美尔频率倒 谱系数(Mel Frequency Cepstrum Coefficient,简称 MFCC)的提取。在此基础上详细 研究了 GMM 模型的基本原理、EM 算法和 K-均值聚类算法,并基于此使用 Matlab 设计实现了基于 GMM 模型的说话人识别系统,完成了 GMM 模型参数的训练和 识别过程。为了分析该说话人识别系统的性能,本文通过实验分析了不同 GMM 模 型阶数和不同训练语音样本时长对系统识别性能的影响。 作为基于 GMM 模型的说话人识别系统应用的扩展,本文将 Matlab 下的设计 实现的基于 GMM 的说话人识别系统用 Java 语言全部重新编写,并最终在安卓平 台上实现。为了分析安卓平台上实现的说话人识别系统的时效性,本文通过实验 分析了不同 GMM 模型阶数和不同测试人数对系统时效性的影响。 论文最后对课题研究进行了总结,并对基于 GMM 模型的说话人识别系统研究 前景作了展望。 关键词:说话人识别;美尔倒谱系数;高斯混合模型;特征提取;安卓 Abstract Speaker Recognition or Voiceprint Recognition is to identify or confirm the speaker by the analysis of the speakers voice signal processing. With the development of embedded software, hardware technology and wireless communications, the system of voice input and control will be the best one of interactive ways in hand-held mobile devices and embedded systems. Therefore, the voiceprint authentication technology has also become increasingly important. The critical research on speaker recognition technology is the feature extraction of speech signal, the model parameters training and recognition, etc. This thesis has realized the speaker recognition system based on GMM model using the MFCC ext

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档