- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
 - 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
 - 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
 
                        查看更多
                        
                    
                
语音识别技术发展及应用 
                     微信智聆语音技术中心 
  大纲 
•     语音识别技术简史 
•     微信智聆语音平台 
•     微信智聆云端案例 
                                                                             2 
   语音识别简史 
传统系统                           2009年联姻深度学习                   2014年端到端初探 
◆ 特征提取 :MFCC ,PLP              ◆ 特征提取 :Fbank                 ◆ 特征提取 :Fbank 
◆ 声学模型 :HMM/GMM模型 ,输出          ◆ 声学模型 :HMM/ DNN ,HMM/ RNN    ◆ 声学模型 :RNN ,输出音素后验概率 
HMM state似然值                   输出HMM state后验概率               ◆ 词典模型 :查表 
◆ 词典模型 :查表                     ◆ 词典模型 :查表                    ◆ 语言模型 :Ngram模型 
◆ 语言模型 :Ngram模型                ◆ 语言模型 :Ngram模型 
语音识别简史 
           2017年端到端系统之CTC 
           ◆  端到端模型 :RNN ,CLDNN ;训练准 
           则CTC准则 
           ◆ 输出word后验概率 
           ◆ 不再需要词典 ,语言模型 
  微信智聆语音平台—— 团队简介 
微信智聆 (WeChat iHearing ) 
l 微信智聆                                  l 论文和专利 
腾讯 自主研发语音技术品牌                           发表语音专业会议icassp ,interspeech等十余篇 
专注于语音识别 ,语音合成 ,声纹认证等语                   拥有专利40多项               成立WXG语音技术 
音人工智能技术的研发                                                      中心 ,团队30人 , 
                                                               博士 占比40% 
l服务对象 
C端 :各类APP、智能硬件 
B端 :政府机构、企业单位 
                                                                    2017 
l核心价值观 
                                          WXG语音 
本着踏实的精神                        团队         技术组 
                               成立 
重视细节的优化 
落地有用的产品                                     2012 
                               2011 
微信智聆语音技术——前端处理 
    微信智聆语音技术——基础语音识别 
 后处理       智能断句      禁词过滤      文本顺滑     书面语转换          微信智聆语音识别系统特点 
                                                       ◆  支持中文 ,粤语 ,英语识别 
             并行解码空间        在线LM重估       RNN LM 
语言模型 
                                                       ◆  多种数据argument技巧 ,扩充训练数 
               时效更新         反馈纠错         …… 
                                                       据多样性 
                CLDNN       Deep CNN     CTC           ◆ 先进的深度学习架构 :CLDNN
                
原创力文档
                        

文档评论(0)