信号统计建模概述.pdf

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信号统计建模概述

信号统计建模概述 杜俊 jundu@ 自我介绍 2004-2009 科大讯飞语音实验室 语音识别/增强 2009-2010 科大讯飞研究院 语音识别/增强 2010-2013 微软亚洲研究院 手写识别/光学字符识别 2013- 中科大语音及语言信息处理国家工程实验室 Google Scholar主页 课程信息及考核 • 课程主页 /~nnf8185/ • 课程考试 – 随堂小测验(40分,共4次) – 期末考试(60分) 课程知识架构 应用层 语音信号、图像信号、生物信号等等 中间层 各种模型工具:GMM 、HMM、 NN等等 底层 微积分数理统计 、线性代数、优化方法等等 课时初步安排 • 信号统计建模概述 • 数学基础知识回顾 • 模式分类 • 手写识别 • 光学字符识别 • 语音增强 课程定位 • 注重应用层面,不追求知识点面面俱到 • 注重概念介绍,不深入探讨细节 • 结合热门应用,对常用数学工具进行重新认识和学习 • 结合实例,认识到工程化能力的重要性 参考资料 • 教材相关 • 课后读物 • Wikipedia, Coursera • 预备知识 – 概率统计相关 – 线性代数和矩阵分析 – 常用编程语言:C/C++, Matlab, Perl 概述 • 多模态技术应用简介 – 语音识别 – 手写识别 – 光学字符识别(OCR ) • 模式分类 – 总体架构 – 特征提取 自然用户界面(NUI ) 多模态技术相关子方向 • 语音编码(Speech Coding ) • 语音增强(Speech Enhancement ) • 语音合成(Speech Synthesis ) • 语音识别(Speech Recognition ) • 语种识别(Language Identification ) • 说话人识别/确认(Speaker Identification/Verification ) • 手势识别(Gesture Recognition ) • 手写识别(Handwriting Recognition ) • 光学字符识别(Optical Character Recognition ) 什么是语音识别 • 人与人语音交流时,识别无处不在 • 让机器听懂人说话 – 最基本的方式:从语音到文本 – 更高级的方式:从语音到理解 • 语音识别的重要意义 – 最自然快捷的人机交互方式之一 – 残疾人士:手和眼睛有使用障碍时 语音识别领域发展现状 • 产业界 – Nuance :全球最大的语音识别技术提供商 – IBM :具有强大数学底蕴的老牌语音识别研究机构 – Microsoft: Windows Phone和Kinect – Google: GOOG-411电话查询,语音搜索 – 科大讯飞,中科信利,百度,腾讯,华为 • 学术界 – Cambridge :HTK工具对学术界研究推动巨大 – CMU :SPHINX系统 – 中科大,清华大学,声学所,自动化所 • 关于实用化的两种论调 语音领域会议及期刊 • 国际会议 – ICASSP International Conference on Acoustics, Speech and Signal Processing – INTERSP

您可能关注的文档

文档评论(0)

zhuwo + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档