- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
优秀毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生学士相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文提供参考!!!
134 4.DSP技术的开发应用
舒琼董金明
北京航空航天大学电子信息工程学院北京100083
摘要:本文通过对多核DSPSOC在手机上开发高级语音识别功能的讨论,针对DSP的选择以及对在手持
设备上实现高级语音识别功能的技术要点进行了讨论.
关键词:DSP
SOC自动语音识别
一、引言
语音识别研究的根本目的是研究出~种具有听觉功能的机器,能直接接受人的口呼命令,理解人的意图
并做出相应的反映。语音识别系统的研究涉及微机技术、人工智能、数字信号处理、模式识别、声学、语言
学和认知科学等许多学科领域,是一个多学科综合性研究领域。目前个人手持设备语音的主要应用大都局限
于语音拨号、语音菜单导航等初级应用,随着语音识别技术的发展,语音识别的其它应用如文本语音转换、
变声等技术也在逐步推广。毫无疑问,利用语音应用增值可带来丰厚的潜在利益,不论是对语音识别设备制
造商、应用开发商、服务提供商来说都是一个极大的商业机会。
本文中将针对语音识别在手机上的实现展开一些讨论。
二、设计语音识别系统时的考虑因素
根据实际中的应用不同,语音识别系统可以分为:特定人与非特定人的识别、独立词与连续词的识别、
小词汇量与大词汇量以及无限词汇量的识别。但无论哪种语音识别系统,其基本原理和处理方法都大体类似。
一个典型的语音识别系统的原理图如图1所示:
图1 语音识别系统原理图
语音系统必须满足某些基本使用要求。首先,语音输出必须清晰,使用户能够听懂。其次,识别引擎必
须准确,在给定应用用途中,ASR必须支持自然语音包括从逐字发出的简单名字和指令、到说出大量词汇的
连续语句。同时,在这种应用中,由于各人的自然语音以及发音方式也不同,系统应该能够灵活接受不同说
话人说话。
在系统设计时,对庞大词库的支持和语音信号的大量处理必将大大增加系统的功耗,从而缩短电池寿命
和使用时间。当应用需要采用处理器外置存储器时,响应时间也有可能增加。如果再考虑到对其他语言的支
持、跟讲者相关(训练语音识别设备使之熟悉用户的声音特征)或跟讲者无关(语音识别设备可以识别任何人的
声音)以及抗噪音和抗干扰性,在使用时所需要的内存和运算的复杂度还会加倍,DSP的计算负荷也会随着词
汇量和训练数据的增加而增大。
因此,在手持设备的应用中,ASR系统的成败很大程度上取决于DSP的功能和设计。而处理速度、功
耗和代码密度三方面则是系统架构设计中最重要的考虑因素。
全国第::詈嚣主菁曩篆理联合学术会议敞集 蜥
三、实现结构讨论
1.系统整体结构:多DSP核SOC
On
SOC(System
高级编程语言编译器,在大大简化开发流程的同时,其增强的片上仿真和调试功能还可以进一步缩短设计时
间。同时在设计SOC时,可以选择具有可调功率功能的内核。
用多个DSP能使系统在完成语音识别的同时更容易地执行其它任务。并且,多个DSP加上大型片上存储器
可以极大地缩短跟讲者无关的训练过程,因为在统计型ASR中训练过程的计算负载比识别处理过程的负载重
得多。
2.DSP的选择标准
(i)性能与功耗
SCl40就采用了指令
通常来讲,DSP采用并行结构来获得最佳的性能空间。平衡型并行结构StarCore
点在于它支持在内存中完成高效的指令调度、执行和打包。它能通过一个指令队列对前端提供反馈,并通过
调度器控制后端,因此除非需要执行计算,VLES处理一般不消耗功率。
由于VIES结构不需要空操作,其设计中的复杂性就从硬件或编程器转移到了编译器。同时.由于每个
周期都在进行数据处理,极大提高了单周期的工作效率,也提高了电源与内存的使用效率。
(2)指令集
高性能DSP中,选择16位而非32位指令集更能提高代码密度,进一步减少对内存、功耗和体积的需求。
这是由于与32位指令集相比,16位指令集可以减少寄存器和数据线数量。
(3)存储器的选择
由于ASR系统需要大量的存储空间用于词汇与模式识别数据的存储,一个灵活的存储结构在
文档评论(0)