基于VQ的语音遥控系统设计.docVIP

下载本文档

4
0
约5.67万字
约 9页
2017-06-11 发布于贵州
举报
版权申诉

基于VQ的语音遥控系统设计.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于VQ的语音遥控系统设计

基于的语音遥控系统设计 ?基于的语音遥控系统设计家用电器领域发展的一个重要趋势是人机交互将更加友好，使用更为简便。提高家电产品人机交互能力的一个重要手段是采用语音识别和语音合成实现语音交互，其中，语音识别技术实现技术难度相对更大。语音识别主要指让机器听懂人说的话，即准确识别出语音的内容，从而根据其信息，执行人的意图。它输入多维模式识别和智能接口的范畴。[7]目前，语音识别广泛应用于军事领域、安全领域、娱乐领域等。语音识别领域发展很迅速，目前语音识别方法有：基于的方法；随机模型法，比如方法；基于人工神经网络的方法等，其中基于的方法利用离散数值表示矢量，能够大大压缩信息量，减少数据存储量；同时无需考虑复杂的统计模型和复杂的时间归整问题，运算相对简单，因此得到了广泛应用。尤其在识别小词汇表孤立词时算法优点更为突出。家电领域是小词汇表孤立词识别系统，适合家用电器应用的语音识别算法需要满足两个基本条件：一、简单，就是该算法所需要的硬件资源较少，以节约硬件成本。二、快速，就是能够做到实时识别，没有迟滞性。算法恰好能够满足这两个要求。本文将以语音遥控系统设计为例探讨基于算法的语音识别算法。文章的第一部分是引言，简单介绍背景，第二部分介绍算法的背景知识；第三部分介绍基于算法的语音识别系统的设计，包括硬件设计和软件设计；第四部分是实验部分。　　矢量量化()算法原理基于的语音识别采用模式匹配原理。矢量量化是一种高效的数据压缩技术，它将维欧氏空间中的模拟矢量X依据某种准则用维空间中的有限个点{|=1,2,…,}表示。在矢量量化理论中，X称为输入矢量，称为量化矢量,{|=1,2,…,}称为码本或码书，码字的数目称为码本容量。矢量量化的准则是在给定码本大小时使量化所造成的失真最小，如果所有的维矢量都用有限的个码字表示，并将所有的码字进行编号，那么所有的维矢量都可以用这些码字的码号表示，从而可以有效的实现数据压缩。码本的设计码本的设计决定了算法能否给出较低的畸变值和较高的质量。设(X,)为X和之间的畸变，码本设计的规则为：第一，X选择码字时遵循“最近邻原则”，即；第二，设所有选择码字的输入矢量X的集合为，那么应使此集合中所有矢量与之间的畸变平均值为最小。X与之间的畸变等于它们的欧氏距离，则等于中所有矢量的“质心”，即：其中是中所包含的矢量个数。码本的形成一般采用算法，这是一种最优的矢量量化器设计方法。算法的基本原理是：对所有语音帧向量以初始码本作最短距离分类，即将各语音帧向量归类到初始码本中距离最近的码字中去。所有训练向量归类结束后，分别对归类于某一类的所有语音向量求重心，将对每一类求得的重心代替该类原来的初始码字，得到一个新的码本。再以此码本替代原来的初始码本，重新再进行归类。重复上述过程直至新旧码本间的距离小于给定阈值为止。语音识别流程采用基于无记忆的语音识别流程如下： 1) 训练时，将同一字音的各训练序列的各帧特征，进行聚类，可以得到含有规定数目()码字的一个标本，称为该字音的码本。对于整个识别系统，词汇表内每个字音具有其单独的码本。 2) 通过统计确定拒识阈，即如果待识音对某码本的标志距离超过该距离，则将不是该码本相应的字音。拒识阈的选择通常通过大量统计事先确定。过大或者过小将导致误识或者拒识。 3) 识别时，待识音帧序列的每帧特征与某字音码本的个码字依次作比较，记下个距离中的最小距离。整个语音帧序列的各最小帧距离之和作为“判别距离”(标志距离)。经过逐一计算，对与每个字音码本，该待识音都有一个标志距离。如果最小标志距离值小于拒识阈，则最小标志距离所对应的字音作为识别结果。　本系统由三个部分组成：第一部分为模数转换部分，接收输入的语音信号，并将其转化成数字采样信号；第二部分为语音识别部分，对输入的数字语音词条信号进行分析，识别出词条信号所代表的命令，由完成；第三部分是系统控制部分，将语音识别结果转换成相应的控制信号，完成具体控制功能。下面对语音识别算法的软件实现及遥控系统控制部分作详细的讨论。硬件设计语音遥控的硬件框图如图1所示。它由两个独立的子模块组成：语音信号处理模块和系统控制模块。语音信号处理模块由324、2181、存储器28020组成。其中324对麦克风输入信号进行放大，28020为存储器，存储的数据为语音识别所需的参数、语音识别算法产生的中间数据、训练后的码本数据、系统的应用程序。2181是公司的16位的定点芯片，是整个语音识别模块的核心，负责语音识别、以及存储器的读写控制。系统控制模块由8952单片机、红外接收发送器、电源管理电路、键盘和