语音信号处理.docVIP

下载本文档

10
0
约7.42千字
约 12页
2017-02-08 发布于湖北
举报
版权申诉

语音信号处理.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

语音信号处理

华北水利水电大学语音信号处理课程报告嵌入式语音识别系统学院：信息工程专业：通信工程姓名：刘建学号： 201215707 摘要：本文首先给出了一种适合于在嵌入式平台上实现的可变命令集的非特定人语音识别系统,同传统的基于PC 的非特定人语音识别系统相比,该系统具备内存消耗小,运算速度快的优点。然后给出了该语音识别系统在多种嵌入式平台上的实现和评估结果,论证了非特定人语音识别系统在嵌入式平台上实现的可行性及其对硬件的最低配置要求,在技术层次上分析了目前实现高性能语音识别SOC 的主要问题和困难,并指出了今后相关的研究方向。前言随着计算机软硬件技术、半导体技术、电子技术、通讯技术和网络技术等的飞速发展,人类已经进入后PC 时代。这个时代一个典型的特征就是:各种新型智能化的设备日益广泛地走进人们的工作和生活,而人与这些智能化终端之间的自然快捷稳定可靠的交互方式有助于提高人机交互的效率,增强人对智能化设备的控制。作为人机交互最自然的方式,语音技术的研究近几十年来取得了长足的进展,其中语音识别由于其重要性和研究的难度更成为研究的热点。嵌入式语音识别系统是指应用各种先进的微处理器在板级或是芯片级用软件或硬件实现语音识别技术。语音识别系统的嵌入式实现要求算法在保证识别效果的前提下尽可能优化, 以适应嵌入式平台存储资源少、实时性要求高的特点。实验室中高性能的大词汇量连续语音识别系统代表当今语音识别技术的先进水平。但由于嵌入式平台在资源和速度方面的限制, 其嵌入式实现尚不成熟。而中小词汇量的命令词语音识别系统由于算法相对简单,对资源的需求较小,且系统识别率和鲁棒性较高,能满足大多数应用的要求,因而成为嵌入式应用的主要着眼点。目前,在嵌入式平台实现了的主要是对系统的运算资源和存储资源要求比较低的特定人孤立词语音识别系统[7 ] 。而在现实中,更多的语音识别应用要求系统具有非特定人的特点。相对而言,特定人语音识别系统可以对整词声学建模,识别则采用简单的DTW等匹配算法,这对小词汇量识别系统的实现效果比较理想。其缺点是,如果词表更换,就要求采集大量数据, 重新训练模型,且训练好的模型又具有特定人的局限。本文介绍的非特定人语音识别系统采用基于汉语声韵母的声学建模单元,命令集可变,更换词表时无需重新训练模型,避免了特定人识别系统词表增大模型空间线性增加的缺点。此项研究的目的在于:通过比较不同平台上的系统实现,分析语音识别系统嵌入式实现的最低运算和存储资源配置要求及系统优化方向,为语音识别系统板级及芯片级的设计开发提供参考依据。为使系统尽可能少的占用嵌入式平台存储和运算资源并保证识别效果,我们对系统进行了优化,采用压缩的声学模型。我们分别在数字信号处理能力强的DSP 平台和通用性好、性价比高的ARM平台上实现了该系统,考虑到不同的处理器及不同的硬件平台在系统时钟频率、数据处理速度、存储资源、缓冲机制等方面的差异,针对不同的平台对系统进行了模型大小及代码等方面的优化,进一步给出了在各平台上系统实现所要求的最小硬件资源配置及系统能达到的最高实时性能。嵌入式板级平台的测试评估结果为今后语音识别片上系统(SOC) 的研制奠定了技术基础。本文各小节内容安排如下:第二部分给出了一种适合于嵌入式平台实现的非特定人语音识别系统及其改进系统,第三部分分别介绍了三种嵌入式平台,第四部分给出了该非特定人语音识别系统的实验结果及其在不同嵌入式平台上的评估结果,并对结果进行了分析,最后是本项研究的阶段性结论,并对今后嵌入式语音识别技术的研究方向进行了探讨和展望。二、适用于嵌入式平台的基于汉语声韵母建模的非特定人语音识别系统汉语大词汇量连续语音识别系统(LVCSR) 一般采用以声韵母为建模单元的上下文相关的声学模型,一遍或多遍的搜索算法,以及N2GRAM的语言模型,词汇量一般达到几万个词, 因此对运行平台的计算能力和存储能力要求非常高,目前只能在主流的PC 机上运行。听写机曾是LVCSR 的主流应用模式,但在实际应用中,由于语音识别引擎的识别率及其鲁棒性还不能达到应用的要求,因此听写机的应用并