- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音识别系统的设计与实现.pdf
VA 誓蠹 技【术应用】
语音识别系统的设计与实现
杜胜超
(郑,、I1铁路局郑卅I通信段 河南 郑卅 『450052)
摘 要: 对语音信号进行预处理,包括预滤波、采样、量化、分帧、加窗以及端点检测等内容:采用能够反映人对语音信号的感知特性的Mel频率倒谱系数作
为语音信号的特征参数;应用 目前在语音识别中广泛应用的技术一一动态时间规整技术作为识别算法。测试结果表明,利用该技术进行语音识别,准确率可达到
95%以上,识别效果 良好。
关键词: 语音识别:美尔倒谱差分;动态时间规划;端点检测
中图分类号:TN91 文献标识码:h 文章编号:1671--7597(2010)0510126一们
O引言 这里,实际频率 /的单位是 。
伴随着计算机技术的不断发展 ,语音识别技术已经成为当今信息产业 MFCC参数的计算过程的具体步骤如下:
领域的标志性技术之一,在人机交互应用中逐渐进入我们日常的生活。本 1)~帧采样语音 {X ,,N为帧长,对 ,~HHamming窗后
文在分析了识别系统可行性的基础之上,提出了实现孤立词识别系统和说 作N点FFT,将时域信号转化为频域分量{ 取模的平方得到离散功
话人识别系统的方法。在特定人孤立词语音识别中,最为简单有效的方法 率谱 (H);
就是动态时间规整算法,该算法基于动态规划思想,解决了发音长短不一 2) ()通过带通滤波器组所得功率值,即计算 ()与日 (月)在各离
的模板匹配问题。本文对语音识别的相关技术进行了研究,为语音识别系 散频率点上乘积之和,得到M个参数 ;
统的发展提供了依据。 3)计算 的自然对数,再用离散余弦变换 (DCT)将结果变换到倒
1语音识别技术分析 谱域;
1.1语音识别的基本流程 4)差分倒谱参数:标准的MFCC参数只反映语音参数静态特性,而人
一 个语音识别系统主要包括语音信号预处理、信号特征参数提取、建 耳对语音动态特征更为敏感,常用差分倒谱参数来描述动态特性 ,如式
立模板库 、进行模式匹配几个阶段。其 中,语音信号预处理包括:预滤 (3)所示:
波、采样、量化、加窗、端点检测、预加重等环节。 AC(n)= ∑tfc·(”+f),1H≤K (3)
语音信号预处理模块,对输入的原始信号进行处理,包括预滤波、采 一 I
样、量化、预加重、分帧加窗、端点检测等环节。滤除掉其中不重要的信
息以及背景噪声等,并进行语音信号的端点检测,即判定语音有效范围的 这里AC和c都表示一帧语音参数,k为常数,通常取2 这时差分参
开始和结束位置,并进行语音分帧以及预加重等处理工作。 数就成为当前帧的前两帧和后两帧参数的线性组合。
1.2语音识别特征参数选取 2.3系统模式匹配的算法一 动态时间规整 (DTW)
目前常用 的有线性预测倒谱系数 (LPCC)以及Me1频率倒谱系数 为了测试两模式 和 之间的相似度,可以计算它们之间的失真Dl,RI,
(MFCC)两种特征参数。与LPCC参数相 比,MFCC参数具有 以下优点: 失真越小相似度越高。为了计算这一失真,应该对r和 中各个对应帧之
1)MFCC参数将线性频标转化为Me1频标 ,强调语音的低频信息,从而 间的失真算起。设n和m分别是 和 中任意选择的帧号,DI )I表
突出了有利于识别的信
原创力文档


文档评论(0)