- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音信号处理
华北水利水电大学
语音信号处理课程报告
嵌入式语音识别系统
学院: 信息工程
专业: 通信工程
姓名: 刘 建
学号: 201215707
摘要:本文首先给出了一种适合于在嵌入式平台上实现的可变命令集的非特定人语音识别系统,同传统的基于PC 的非特定人语音识别系统相比,该系统具备内存消耗小,运算速度快的优点。然后给出了该语音识别系统在多种嵌入式平台上的实现和评估结果,论证了非特定人语音识别系统在嵌入式平台上实现的可行性及其对硬件的最低配置要求,在技术层次上分析了目前实现高性能语音识别SOC 的主要问题和困难,并指出了今后相关的研究方向。
前言
随着计算机软硬件技术、半导体技术、电子技术、通讯技术和网络技术等的飞速发展,人类已
经进入后PC 时代。这个时代一个典型的特征就是:各种新型智能化的设备日益广泛地走进人们
的工作和生活,而人与这些智能化终端之间的自然快捷稳定可靠的交互方式有助于提高人机交
互的效率,增强人对智能化设备的控制。作为人机交互最自然的方式,语音技术的研究近几十年
来取得了长足的进展,其中语音识别由于其重要性和研究的难度更成为研究的热点。
嵌入式语音识别系统是指应用各种先进的微处理器在板级或是芯片级用软件或硬件实现语音识别技术。语音识别系统的嵌入式实现要求算法在保证识别效果的前提下尽可能优化,
以适应嵌入式平台存储资源少、实时性要求高的特点。实验室中高性能的大词汇量连续语音
识别系统代表当今语音识别技术的先进水平。但由于嵌入式平台在资源和速度方面的限制,
其嵌入式实现尚不成熟。而中小词汇量的命令词语音识别系统由于算法相对简单,对资源的
需求较小,且系统识别率和鲁棒性较高,能满足大多数应用的要求,因而成为嵌入式应用的主
要着眼点。
目前,在嵌入式平台实现了的主要是对系统的运算资源和存储资源要求比较低的特定人
孤立词语音识别系统[7 ] 。而在现实中,更多的语音识别应用要求系统具有非特定人的特点。
相对而言,特定人语音识别系统可以对整词声学建模,识别则采用简单的DTW等匹配算法,这
对小词汇量识别系统的实现效果比较理想。其缺点是,如果词表更换,就要求采集大量数据,
重新训练模型,且训练好的模型又具有特定人的局限。本文介绍的非特定人语音识别系统采
用基于汉语声韵母的声学建模单元,命令集可变,更换词表时无需重新训练模型,避免了特定人识别系统词表增大模型空间线性增加的缺点。
此项研究的目的在于:通过比较不同平台上的系统实现,分析语音识别系统嵌入式实现的
最低运算和存储资源配置要求及系统优化方向,为语音识别系统板级及芯片级的设计开发提
供参考依据。
为使系统尽可能少的占用嵌入式平台存储和运算资源并保证识别效果,我们对系统进行
了优化,采用压缩的声学模型。我们分别在数字信号处理能力强的DSP 平台和通用性好、性价比高的ARM平台上实现了该系统,考虑到不同的处理器及不同的硬件平台在系统时钟频
率、数据处理速度、存储资源、缓冲机制等方面的差异,针对不同的平台对系统进行了模型大小
及代码等方面的优化,进一步给出了在各平台上系统实现所要求的最小硬件资源配置及系统
能达到的最高实时性能。嵌入式板级平台的测试评估结果为今后语音识别片上系统(SOC) 的
研制奠定了技术基础。
本文各小节内容安排如下:第二部分给出了一种适合于嵌入式平台实现的非特定人语音
识别系统及其改进系统,第三部分分别介绍了三种嵌入式平台,第四部分给出了该非特定人语
音识别系统的实验结果及其在不同嵌入式平台上的评估结果,并对结果进行了分析,最后是本
项研究的阶段性结论,并对今后嵌入式语音识别技术的研究方向进行了探讨和展望。
二、适用于嵌入式平台的基于汉语声韵母建模的非特定人语音识别系统
汉语大词汇量连续语音识别系统(LVCSR) 一般采用以声韵母为建模单元的上下文相
关的声学模型,一遍或多遍的搜索算法,以及N2GRAM的语言模型,词汇量一般达到几万个词,
因此对运行平台的计算能力和存储能力要求非常高,目前只能在主流的PC 机上运行。听写
机曾是LVCSR 的主流应用模式,但在实际应用中,由于语音识别引擎的识别率及其鲁棒性还
不能达到应用的要求,因此听写机的应用并
您可能关注的文档
最近下载
- 青少年趣味编程(Python)第十一节多分支选择if-elif 课后服务.pptx VIP
- 金蝶云星空+V7.6产品培训_财务_税务管理.pptx VIP
- 药品生产质量管理题库(附答案).docx VIP
- 山东省青岛市李沧区九年级(上)期末化学试卷 (2).doc VIP
- 办公楼保洁项目重点难点及解决方案.pdf VIP
- 卫生院职能部门对药物临床应用进行监测与评价,有持续改进的成效.docx VIP
- 满足顾客需求培训(ppt 39页).ppt VIP
- 22S702 室外排水设施设计与施工-钢筋混凝土化粪池图集.pdf VIP
- 青少年趣味编程(Python)第十节 if-else条件语句 课后服务.ppt VIP
- 教学课件24 稀硝酸生产.ppt VIP
原创力文档


文档评论(0)