- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
语音识别研究
语音识别技术是一门涉及面很广的交叉学科。随着新理论的提出和应用,语
音识别技术取得了很大的进步,许多产品已经得以实际的应用,但在其进一步的
发展进程中,还有许多棘手的问题有待解决。
标签:语音识别;动态时间规整算法;人工神经元网络
1背景介绍
语言是人类特有的功能,是人们思维最重要的寄托体,是人类交流最主要的
途径。语音是语言的声学表现,是人类交流信息最自然、最有效、最方便的手段。
语言和语音与人类社会科学文化发展紧密相连。
语音识别技术是让机器接收,识别和理解语音信号,并将其转换成相应的数
字信号的技术。它是一门交叉学科,涉及到语音语言学、数理统计、计算机、信
号处理等一系列学科。
2发展历史
1952年贝尔实验室的Davis等人研制成功了能识别十个英文数字发音的
Audry系统,标志着语音识别技术研究工作开始。20世纪60年代计提出了动态
规划(Dynamicprogramming)和线性预测分析技术(LinerPredictive)等重要成果。
20世纪70年代,语音识别领域取得了突破。实现了基于线性预测倒谱和DTW
技术的特定人孤立语音识别系统。20世纪80年代语音识别研究进一步走向深入,
基于特定人孤立语音技术的系统研制成功,隐马尔可夫模型和人工神经元网络
(ArtificialNeuralNetwork)在语音识别中的成功应用。进入20世纪90年代后语音
识别系统开始从实验室走向实用。我国对语音识别的研究开始于20世纪80年代,
近年来发展迅速,并取得了一系列的成果。
3具体应用
随着计算机技术、模式识别等技术的发展,适应不同场合的语音识别系统相
继被开发出来,语音识别及处理技术已经越来越突现出其强大的技术优势。近三
十年来,语音识别在计算机、信息处理、通信与电子系统、自动控制等领域的应
用越来越广泛。
在许多政府部门、商业机构,语音识别技术的应用,可免除大量操作人员的
重复劳动,既经济又方便。如:语音邮件、IP电话和IP传真、电子商务、自动
语音应答系统、自动语音信箱、基于IP的语音、数据、视频的CTI系统、综合
语音、数据服务系统、自然语音识别系统、专家咨询信息服务系统、寻呼服务、
故障服务、秘书服务、多媒体综合信息服务、专业特别服务号(168自动信息服务
系统,112、114、119等信息查询系统)等。许多特定环境下,如工业控制方面,
在一些工作环境恶劣、对人身有伤害的地方(如地下、深水及辐射、高温等)或手
工难以操作的地方,均可通过语音发出相应的控制命令,让设备完成各种工作。
当今,语音识别产品不仅在人机交互中,占到的市场比例越来越大,而且在
许多领域都有了广阔的应用前景,在人们的社会生活中起着举足轻重的作用。
4语音识别系统原理
语音识别一般分为两个步骤:学习阶段和识别阶段。学习阶段的任务是建立
识别基本单元的声学模型以及语言模型。识别阶段是将输入的目标语音的特征参
数和模型进行比较,得到识别结果。
语音识别过程如图所示。下面对该流程作简单介绍:
(1)语音采集设备如话筒、电话等将语音转换成模拟信号。
(2)数字化一般包括预滤波、采样和A/D变换。该过程将模拟信号转变成
计算机能处理的数字信号。
(3)预处理一般包括预加重、加窗分帧。经预处理后的信号被转换成了帧
序列的加窗的短时信号。
(4)参数分析是对短时信号进行分析,提取语音特征参数的过程,如时域、
频域分析,矢量量化等。
(5)语音识别是目标语音根据特征参数与模型库中的参数进行匹配,产生
识别结果的过程。一般有模板匹配法、随机模型法和神经网络等。
(6)应用程序根据识别结果产程预定动作。
(7)该过程是语音模型的学习过程。
5现有算法介绍
语音识别常用的方法有:模板匹配法、人工神经网络法。
(1)模板匹配法是语音识别中常用的一种相似度计算方法。模板匹配法一
般将语音或单词作为识别单元,一般适用于词汇表较小的场合。在训练阶段,对
用户语音进行特征提取和特征维数的压缩,这个过程常用的方法是采用矢量量化
(VQ)技术。然后采用聚类方法或其他方法,针对每个模式类各产生一个或几
个模板。识别阶段将待识别的语音模式的特征参数与各模板进行相似度的计算,
您可能关注的文档
- 求职面试的语言技巧.pdf
- 美国中小学外语教育改革情况.pdf
- 最高医患纠纷司法解释是什么?.pdf
- 传承和弘扬中华优秀传统文化.pdf
- 下雨天吸引人的文案80句.pdf
- PDCA使用指南详解.pdf
- 校园环保活动策划方案.pdf
- 赴美留学成绩不好可以申请奖学金吗?.pdf
- 产品市场前景调研报告.pdf
- 北师大版四年级下册书法练习指导教案1-16课全.pdf
- 2024高考物理一轮复习规范演练7共点力的平衡含解析新人教版.doc
- 高中语文第5课苏轼词两首学案3新人教版必修4.doc
- 2024_2025学年高中英语课时分层作业9Unit3LifeinthefutureSectionⅢⅣ含解析新人教版必修5.doc
- 2024_2025学年新教材高中英语模块素养检测含解析译林版必修第一册.doc
- 2024_2025学年新教材高中英语单元综合检测5含解析外研版选择性必修第一册.doc
- 2024高考政治一轮复习第1单元生活与消费第三课多彩的消费练习含解析新人教版必修1.doc
- 2024_2025学年新教材高中英语WELCOMEUNITSectionⅡReadingandThi.doc
- 2024_2025学年高中历史专题九当今世界政治格局的多极化趋势测评含解析人民版必修1.docx
- 2024高考生物一轮复习第9单元生物与环境第29讲生态系统的结构和功能教案.docx
- 2024_2025学年新教材高中英语UNIT5LANGUAGESAROUNDTHEWORLDSect.doc
最近下载
- 第12课 新文化运动 课件(23张PPT).pptx
- 机载临时支护装置安装使用说明书.docx
- 中国基本国情教案(汉语国际教育).docx
- 人教版数学二年级上册第五单元《观察物体(一)》大单元整体教学设计.doc
- 第2章 直线与圆的位置关系 复习课.doc VIP
- 中职学校《金属加工与实训》全套电子教案(含教学进度计划)(配套教材:高教版中职统编)云天课件( word 版).docx
- 程家惠《洋话汉音》(升级版).doc
- onbon仰邦科技 六代三基色控制器 BX-6K系列 规格书 本压缩包包含BX-6K1、6K2、 6K3、6K4-T08、6K4-T12 5个产品的规格书。说明书用户手册.pdf
- 职业生涯规划书ppt职业生涯规划书ppt.ppt
- 卡拉OK数码功放KMA-1080KMA-980中文使用说明书.pdf
文档评论(0)