基于fpga的说话人识别系统设计.pdfVIP

下载本文档

26
0
约8.78千字
约 5页
2016-01-24 发布于天津
举报

基于fpga的说话人识别系统设计.pdf

基于fpga的说话人识别系统设计

基于FPGA 的说话人识别系统设计陈勇，李晶皎，石鑫，张莉佳摘要：说话人识别作为一种生物识别技术，能够根据测试语音来辨别说话者的身份。本文针对实时性问题提出了一种以FPGA(Field Programmable Gate Array)为硬件平台的解决方案。该方案以MFCC 为语音特征，采用了基于矢量量化的说话人识别算法。系统主要包括语音信号采集、端点检测、特征提取和识别判断4 个部分。经测试证明，该系统完成了文本相关的说话人识别系统的基本功能。在实验室条件下，当系统时钟为50MHz 时，完成一次4 码本系统的识别耗时15.932ms；12 码本系统的识别率为93.3% 。关键词：说话人识别；端点检测；MFCC；矢量量化；FPGA Design of Speaker Recognition System Based on FPGA Abstract ：As a biometric identification technology, speaker recognition can verify the identity according to the test voices. For real-time problem, this paper presents a solution that makes the FPGA as the hardware platform. The system consists of four parts: Signal Acquisition, Endpoint Detection, Feature Extraction and Identification. The experiment results show that the time-consuming is 15.932ms on the 4 codebooks and 50MHz-clock system, the identification rate is 93.3% on the 12 codebooks system. This kind of design improves the system’s recognition speed, which is an effective program to solve the real-time problem. Keywords: Speaker Recognition; VAD; MFCC; Vector Quantization; FPGA 1. 说话人识别理论基础说话人识别的过程可以分为：语音信号预处理、特征提取和识别判断三个部分。其中，识别判断由码本训练和识别两部分组成，原理如图1.1 所示。训练码本语音信号预处理特征提取计算失识别判决识别真测度图1.1 说话人识别原理图语音信号的预处理包括采样和量化、预加重、分帧、加窗、端点检测等。预处理的目的是去除噪声，加强有用的信息，并对输入应测量仪器或其他因素造成的退化现象进行复原。特征提取是系统关键部分。近年来，一种能够比较充分利用人耳非线性系统感知特性的参数得到了广泛的应用，这就是Mel 频率倒谱系数[1] 。临界频率带宽随着频率的变化而变化，并与Mel 频率增长一致[2] 。在1000Hz 以下，大致呈线性分布，带宽为100Hz 左右；在1000Hz 以上呈对数增长，具体如式(1.1)所示。 Mel

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

基于fpga的说话人识别系统设计.pdfVIP