苏州电子信息专业师资培训班资料语音信号处理课程研讨.pptVIP

苏州电子信息专业师资培训班资料语音信号处理课程研讨.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
学科进展:语音识别 迫切的需求与技术的进步 移动互联网时代对语音识别的需求更为迫切; 计算能力的提升(多核处理器、GPGPUs、CPU/GPU集群,计算能力提高了几个数量级)使得复杂模型的训练成为可能; 数据资源越来越丰富(互联网、云计算)使得能用更真实的数据训练模型。 理论方法的重要进展 深度学习理论的出现与完善。 Geoffrey. Hinton 学科进展:语音识别 深度学习明显提高了语音识别性能 使LVCSR错误率降低了三分之一以上 以产业界为主:源于在数据、计算资源上的优势 引领发展的单位 Microsoft IBM 谷歌 学科进展:语音合成 合成语音的自然性 提高可懂度、表现力是语音合成技术持续追求的目标; 基于HMM参数的合成是近年来主流的方法。 基于深度学习的参数化合成是当前的热点 HMM在描述语音与其声学特征间所存在的复杂和非线性关系上有局限性; 借鉴深度学习在语音识别上的成功应用,其被应用到了语音合成中。 学科进展:语音编码 语音编码 一类是朝着窄带低码率语音编码方向发展,主要是提高可懂度,用于军事等通信; 另一类是朝着宽带高速率分层编码方向发展,主要用于基于包交换的移动互联网,提高人类对音质的需求。 联系信息: 通信地址:哈尔滨工业大学计算机学院321信箱 邮政编码:150001 办公地址:哈尔滨工业大学一校区综合楼608室 办公电话:(0451 电子邮件:jqhan@ 个人主页:/hanjiqing 谢 谢 ! * 课堂教学 课程所需要的基础知识 课程讲授时的主要线索 课堂教学:基础知识 数学:线性代数、随机过程、概率统计 计算机科学:数据结构、模式识别、机器学习 信息与通信工程:信号与系统、数字信号处理、数据压缩 基础层(共性技术) 应用层(个性特点) 数字信号处理 课堂教学:基础知识 数学:线性代数、随机过程、概率统计 计算机科学:数据结构、模式识别、机器学习 信息与通信工程:信号与系统、数字信号处理、数据压缩 模式识别/机器学习 数据压缩 数字信号处理 基于语音的特点进行特征提取 两 个 途 径 课堂教学:基础知识 发音过程 基 频 共振峰 LPC LPCC等 Mel频带能量 PLP等 听觉过程 Mel频率倒谱系数特征MFCC 课堂教学:基础知识 模式识别/机器学习 数据压缩 时间序列的数据压缩 与模式识别/机器学习 课堂教学:主讲教师 韩纪庆、郑铁然 学校专业:哈尔滨工业大学、计算机科学与技术 学生类型:本科三年级、研究生 课程类型:专业选修课 张磊 学校专业:哈尔滨工程大学、信息与通信工程 学生类型:本科三年级、研究生 课程类型:专业选修课 课堂教学:讲授线索 本门课程可以采用多条讲授线索 对不同类型的学生,教学时侧重不同的讲授线索 一般应有多条线索齐头并进 课堂教学:讲授线索 面向研究方向的讲授线索 面向应用实践的讲授线索 面向跨领域知识的讲授线索 面向问题求解的讲授线索 面向模式识别和数据压缩的讲授线索 面向研究方向的讲授线索 本课程涵盖了语音处理领域的主要研究方向: 语音识别 说话人识别 语音合成 语音编码 对从事本领域研究工作的学生,一方面应确保其对领域中的各种概念、理论、方法有全面的了解,另一方面要突出重点,对目前的研究焦点给予更多的关注。 面向研究方向的讲授线索 关注点: 语音识别大词表连续语音识别 语音合成基于HMM参数化的语音合成 说话人识别与文本无关的说话人识别 语音编码码激励线性预测声码器 结合本领域的最新研究动态,不断更新教学内容,如数字信号处理中稀疏表示与压缩感知、LVCSR中深度学习等理论的应用。 教学时,应有一部分教学内容与本领域顶级刊物与会议的最新研究进展深度结合。 相关重要刊物与会议 语音处理重要期刊 IEEE/ACM Transactions On Audio, Speech and Language Processing (I

您可能关注的文档

文档评论(0)

带头大哥 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档