[工学]语音信号处理杨震.ppt

  1. 1、本文档共147页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[工学]语音信号处理杨震

语音信号处理 Speech Signal Processing 杨 震 (教授、博导) yangz@njupt.edu.cn 2011.2 绪 论 ☆当今世界正处于信息时代,计算机技术、通信技术和电子技术的高速发展,推动人类社会进入了信息社会。因特网和移动通信的普及、电子购物的兴起、多媒体通信及其应用的蓬勃发展,改变了人类生活、工作、娱乐的方式 ☆信息的获取、处理、传输、显示和存储,是信息技术研究的主要内容 ☆人类作为社会的主人,一直是接收和发送信息的主体 ☆语音,始终是人类互相交流、互相通信的最主要、最方便、最快捷的工具——信息载体 信息与信号 信息是信号的内涵 (1)信息是信号描述的对象 (2)信息是信号载荷的内容 信号是信息的外延 信号是信息在物理表达上的外延,信号是信息的载体 同一信息可以用不同的物理量-信号(声、像、图、文)来载荷,也可以采用不同的数学描述方式(数字或模拟) 同一类型信号也可以代表不同内容的信息 ☆语音信号处理是一门涉及面很广的交叉学科 ☆研究内容包括 1、语音特性分析和建模 2、语音编码 3、语音识别 4、语音合成 5、语音增强 6、语音通信 授 课 内 容 【1】? 绪论 【2】? 声音信号的分类与数字化 【3】? 语音的发声模型和人的听觉特性 【4】 语音信号的时域和频域分析方法 【5】 语音信号的线性预测编码(LPC)技术 【6】 演示实验 【7】 各种语音处理和通信系统的质量评价标准 【8】 语音信号的数字压缩编码标准 授 课 内 容 【9】 语音波形编码技术-part one 【10】语音波形编码技术-part two 【11】语音参数及混合编码技术-part one 【12】语音参数及混合编码技术-part two 【13】人机通信-part one语音识别原理 【14】人机通信-part two语音合成原理 【15】实用系统中的语音增强与消噪技术 【16】语音压缩编码、消噪、识别与合成演示实验 参考文献 1、鲍长春. 数字语音编码原理[M]. 西安: 西安电子科技大学出版社,2007. 2、王柄锡 “语音编码” “变速率语音编码”,西安电子科技大学出版社,2002,2004 3、韩纪庆等 “语音信号处理”,清华大学出版社,2004 4、赵力 “语音信号处理”,机械工业出版社,2003 5、Thomas F.Q “离散时间语音信号处理——原理与应用”,电子工业出版社,2004 6、王晓龙 “计算机自然语言处理”,清华大学出版社,2005 7、拉宾纳,谢佛 “语音信号数字处理” 科学出版社,1978 参 考 文 献 研究动态 1、Proceedings of ICASSP (声学、语音、信号处理国际会议录) 2、IEEE Transactions on Speech and Audio Processing 3、IEEE Transactions on Signal Processing 4、Speech Communications 5、ICSLP(Spoken Language Processing) 6、IEL 数据库 第一章 声音信号的分类与数字化 §1.1 声音信号的分类 语音(speech) ?自然语音 ?窄带语音, 又叫电话频带语音 ?宽带语音 非语声音频信号(audio) ? CD质量声音 ?高保真HiFi(High Fidelity)和环绕(Surrounded Effect)声音 第一章 声音信号的分类与数字化 §1.2 声音信号的特征参数 §1.2.1声音的传播速度、频率、周期和波长 §1.2.2声压、声功率、声强和声级 §1.2.3声音三要素 第一章 声音信号的分类与数字化 §1.3 声音信号的数字化 抽样—量化—编码 常见采样频率 ?电话通信领域的8千赫兹和16千赫兹。 ?计算机声音处理系统中的11.025千赫兹,22.05千赫兹和44.1千赫兹。 ?广播,影视,娱乐领域的32千赫兹,44.1千赫兹和48千赫兹。 第一章 声音信号的分类与数字化 压缩感知 Compressed Sensing 技术及其对于语音信号处理的影响 1、CS基本原理 2、基于CS的语音处理开放性课题 第一章 声音信号的分类与数字化 §1.4 声音信号的数字存储格式 WAV:数字音频波形格式,微软公司开发 MIDI:数字乐器合成器,多用于合成音乐 目前我们遇到的多数为.wav和.mid文件

文档评论(0)

qiwqpu54 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档