- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
语音识别
?语音识别涉及领域?语音识别的类型?语音识别原理框图?DTW算法
语音识别技术就是让机器通过识别和理解过程把人类的语音信号转变为相应的文本或命令的技术,属于多维模式识别和智能计算机接口的范畴。它是语音信号处理学科的一个分支。语音识别系统的本质就是一种模式识别系统。常见的语音识别方法有动态时间归整技术(DTW)、矢量量化技术(VQ)、隐马尔可夫模型(HMM)、基于段长分布的非齐次隐马尔可夫模型(DDBHMM)和人工神经元网络(ANN)
模板匹配方法的语音识别算法需要解决的一个关键问题是说话人对同一个词的两次发音不可能完全相同。设参考模板有M帧矢量{R(1),R(2),…R(m),…,R(M)},R(m)为第m帧的语音特征矢量,测试模板有N帧矢量{T(1),T(2),…T(n),…,T(N)},T(n)是第n帧的语音特征矢量。d(T(i),R(i))表示T中第i帧特征与R中i帧特征之mnm
DTW是把时间规整和距离测度计算结合起来的一种非线性规整技术,它寻找一个规整函数i=Ф(i),将测试矢量的时间轴n非线mn性地映射到参考模板的时间轴m上,并使该函数满足:D就是处于最优时间规整情况下两矢量的距离。
DTW算法的原理图如图把测试模板的各个帧号n=1~N在一个二维直角坐标系中的横轴上标出,把参考模板的各帧m=1~M在纵轴上标出,通过这些表示帧号的整数坐标画出一些纵横线即可形成一个网格,网格中的每一个交叉点(t,r)表示测试ij模式中某一帧与训练模式中某一帧的交汇。DTW算法分两步进行,一是计算两个模式各帧之间的距离,即求出帧匹配距离矩阵,二是在帧匹配距离矩阵中找出一条最佳路径。
搜索从(1,1)点出发,对于局部路径约束如图5-3,点(i,i)可达到的前一个格点只可能nmnmnm(in,im)一定选择这三个距离中的最小者所对应的点作为其前续格点,这时此路径的累积距离为:D(i,i)=d(T(i),R(i))+min{D(i-1,i),D(i-nmnmnmnmnm
?电话通信的语音拨号特别是在中、高档移动电话上,现已普遍的具有语音拨号的功能。随着语音识别芯片的价格降低,普通电话上也将具备语音拨号的功能。?汽车的语音控制对汽车的卫星导航定位系统(GPS)的操作,汽车空调、照明以及音响等设备的操作,同样也可以由语音来方便的控制。?工业控制及医疗领域当操作人员的眼或手已经被占用的情况下,在增加控制操作时,最好的办法就是增加人与机器的语音交互界面。由语音对机器发出命令,机器用语音做出应答。
?个人数字助理的语音交互界面PDA的体积很小,人机界面一直是其应用和技术的瓶颈之一。由于在PDA上使用键盘非常不便,因此,现多采用手写体识别的方法输入和查询信息。随着语音识别技术的提高,语音将成为PDA主要的人机交互界面。?智能玩具?家电遥控用语音可以控制电视机、VCD、空调、电扇、窗帘的操作,而且一个遥控器就可以把家中的电器皆用语音控起来。
语音识别技术的应用发展方向?一个方向是大词汇量连续语音识别系统,主要应用于计算机的听写机,以及与电话网或者互联网相结合的语音信息查询服务系统,这些系统都是在计算机平台上实现的;?另外一个重要的发展方向是小型化、便携式语音产品的应用,如无线手机上的拨号、汽车设备的语音控制、智能玩具、家电遥控等方面的应用,这些应用系统大都使用专门的硬件系统实现,特别是近几年来迅速发展的语音信号处理专用芯片和语音识别片上系统的出现。
您可能关注的文档
- 2024-2030年Led照明OEM和和ODM行业市场现状供需分析及重点企业投资评估规划分析研究报告.docx
- 2024-2030年LED电子驱动器行业市场现状供需分析及重点企业投资评估规划分析研究报告.docx
- 2024-2030年LED立式显微镜行业市场现状供需分析及重点企业投资评估规划分析研究报告.docx
- 2024-2030年LED背光源产业发展分析及发展趋势与投资前景预测报告.docx
- 2024-2030年LED路灯行业风险投资发展分析及投资融资策略研究报告.docx
- 2024-2030年LF 射频识别嵌体行业市场现状供需分析及投资评估规划分析研究报告.docx
- 人教版小学美术四年级上册《精美的邮票》课件.ppt
- 2024-2030年LNG产业市场深度调研及发展趋势与投资前景研究报告.docx
- 2024-2030年LNG液化低温阀行业市场现状供需分析及重点企业投资评估规划分析研究报告.docx
- 2024-2030年LNG运输项目商业计划书.docx
最近下载
- 【幼儿园】幼儿园创建“平安校园”实施方案.docx VIP
- 如何才能做到从思想上入党.pdf VIP
- 教学课件:教学设计与教案.ppt
- 浙江农村信用社招聘-2024温州乐清农商银行秋季招聘笔试备考试题及答案解析.docx
- 建筑结构施工图识读教案.pdf
- 2024小红书知识考核试题题库及答案.pdf VIP
- 青岛农业大学基础生物化学期末复习题导学资料.pdf
- 【新版教材】中学音乐人音版七年级下册《领航》课堂教学设计.docx
- 初中语文 2024年新疆乌鲁木齐市沙依巴克区中考语文适应性试卷.pdf
- HIKVISION海康威视白光全彩400万筒型网络摄像机DS-2CD3T46(D)WDV3-L.pdf
文档评论(0)