- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
上海工程技术大学
毕业设计(毕业论文)开题报告
学院电子电气工程学院
专业电子信息工程
班级学号
学生
指导教师
题目基于DSP的嵌入式语音识别系统设计
《基于DSP的嵌入式语音识别系统设计》
————开题报告
一、选题背景
语言是人类彼此沟通信息的重要工具。随着现代科学技术的进展,
专门是语音通信和各类相关产品的普及,语音信号的数字化处置在愈
来愈多的领域中发挥着相当重要的作用。
所谓的语音技术,无非是一种集合:一种涵盖了识别、合成、检
出关键词、口语对话系统的集合,而那个集合的核心无可厚非即是语
音识别技术,专门是持续识别——这门最初为了解决机械如何能够准
确地解析人的语音内容的学科,正以一种难以想象的态势飞速进展,
给“古板”的机械添上了一份“人性”。
算法运算量大,处置快速高效(不管是实时或准实时)这些都是
一个语音系统的大体要求,而DSP凭借着本身强劲的数据处置能力和
高运行速度挑起大梁,充当起整个系统的“心脏”。它是一种特殊的
微处置器,一种以数字信号来处置大量信息的器件,其工作原理:第
一将接收模拟信号进行转换,转换为0或1的数字信号,再对数字信
号进行修改、删除及强化并在其他系统芯片中把数字数据解译回模拟
数据或实际环境格式。具有可编程性的它,以每秒万万条复杂的令程
序的实时运行速度,让那些通用的微处置器望尘莫及。
二、研究课题的意义
本文实现的语音识别系统要紧由硬件设备和相应的软件算法组
成。在平台上验证和改良了算法(如:预处置、端点检测、特点提取
和模式匹配),然后用C汇编语言结合混编的方式移植到DSP的开发
平台——CCS,最终在ICETEK-VC5416AE-S60实验箱上实现孤立词
(0-9)的识别,而随着库内容的丰硕,本系统将会越发接近当下最
为热点的语音助手——siri。
三、语音识别的研究概况
从1952年Bell实验室的Audry到2021年iphone的Siri。60
年来语音识别这项技术一直都是运算机研究领域内的“香饽饽”,倍
受IBM、微软等IT巨头重视,相关研究功效也层出不穷。
IBM——作为语音识别技术的前驱,以它的ViaVoice软件为例:
能够帮忙人们通过麦克风用语音向字处置软件输入文字,不管是英
语、意大利语、德语、法语、日语仍是汉语等都照单全收。而微软新
版的Windows操作系统Vista,也配置了先进的语音识别软件。用
户动口而不动手来完成通过语音和运算机交流(比如通过口来“书写”
信件或电子邮件······)。而那个功能关于那些“特殊群体”,带来的
便利是不言而喻的。
目前世界上最先进的语音识别软件叫做NaturallySpeaking,
出自于NuanceCommunications公司。NaturallySpeaking已经取
得了大多数用户的认可。对着麦克风说话,屏幕上就显示出说话的内
容,很容易识别和纠正错误。久而久之,该软件会试探出用户的“天
性”。固然,用户若是在说话进程中发觉软件无法识别的,也相应地
作出调整,如此一来,语音识别的正确率就会慢慢提高。
尽管我国语音识别研究工作起步较晚,但目前在该领域中国已占
有了自己的一席之地。这一切都要归功于1987年的863打算,它大
大缩短了从实验室慢慢迈向应用层面的周期。而最作为世界上最有韵
味、最漂亮的语言——汉语咱们也有着近水楼台先得月的优势。
“天语”中文语音系列产品—PattekASR确实是其中的佼佼者,
它终止了中文语音识别产品自1998年以来一直由国外公司垄断的
历史。
清华大学电子工程系语音技术与专用芯片设计课题组,研发的非
特定人汉语数码串持续语音识别系统的识别精度,达到%(不定长数字
串)和%(定长数字串)。在有5%的拒识率情形下,系统识别率能够
达到%(不定长数字串和%(定长数字串),这是目前国际最好的识别结
果之一,其性能已经接近有效水平。研发的5000
您可能关注的文档
最近下载
- TSGZ8001—2019特种设备无损检测人员考核规则(去水印版).pdf VIP
- 企业工会助推企业高质量发展.docx VIP
- 圆明园的毁灭观后感.docx VIP
- 《新能源汽车驱动电机及控制技术》 课件 3.1 电机控制器检测与故障诊断.pptx
- GB∕T 5777-2019 无缝和焊接(埋弧焊除外)钢管纵向和∕或横向缺欠的全圆周自动超声检测(含2021年第一号修改单).pdf
- 汽修安全培训课件.ppt VIP
- 网络改造设计方案.doc VIP
- 《圆明园的毁灭》课文读后感.docx VIP
- 旅游大数据(北京第二外国语)中国大学MOOC慕课 章节测验期末考试答案.docx VIP
- 统编版四年级语文上册课件《西门豹治邺》.pptx VIP
文档评论(0)