语音识别技术发展及应用.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语音识别技术发展及应用 微信智聆语音技术中心 大纲 • 语音识别技术简史 • 微信智聆语音平台 • 微信智聆云端案例 2 语音识别简史 传统系统 2009年联姻深度学习 2014年端到端初探 ◆ 特征提取 :MFCC ,PLP ◆ 特征提取 :Fbank ◆ 特征提取 :Fbank ◆ 声学模型 :HMM/GMM模型 ,输出 ◆ 声学模型 :HMM/ DNN ,HMM/ RNN ◆ 声学模型 :RNN ,输出音素后验概率 HMM state似然值 输出HMM state后验概率 ◆ 词典模型 :查表 ◆ 词典模型 :查表 ◆ 词典模型 :查表 ◆ 语言模型 :Ngram模型 ◆ 语言模型 :Ngram模型 ◆ 语言模型 :Ngram模型 语音识别简史 2017年端到端系统之CTC ◆ 端到端模型 :RNN ,CLDNN ;训练准 则CTC准则 ◆ 输出word后验概率 ◆ 不再需要词典 ,语言模型 微信智聆语音平台—— 团队简介 微信智聆 (WeChat iHearing ) l 微信智聆 l 论文和专利 腾讯 自主研发语音技术品牌 发表语音专业会议icassp ,interspeech等十余篇 专注于语音识别 ,语音合成 ,声纹认证等语 拥有专利40多项 成立WXG语音技术 音人工智能技术的研发 中心 ,团队30人 , 博士 占比40% l服务对象 C端 :各类APP、智能硬件 B端 :政府机构、企业单位 2017 l核心价值观 WXG语音 本着踏实的精神 团队 技术组 成立 重视细节的优化 落地有用的产品 2012 2011 微信智聆语音技术——前端处理 微信智聆语音技术——基础语音识别 后处理 智能断句 禁词过滤 文本顺滑 书面语转换 微信智聆语音识别系统特点 ◆ 支持中文 ,粤语 ,英语识别 并行解码空间 在线LM重估 RNN LM 语言模型 ◆ 多种数据argument技巧 ,扩充训练数 时效更新 反馈纠错 …… 据多样性 CLDNN Deep CNN CTC ◆ 先进的深度学习架构 :CLDNN

文档评论(0)

fengruiling + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档