语音信号处理解答.ppt

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语 音 信 号 处 理 郑能恒 nhzheng@ 人与人之间、人与机器之间的语音信息处理过程 (人) 行 动 意 图 说话方 收听方 ○ 语言形成 发 音 收 听 认识 · 理解 传输系统 (编码、解码) 空间传播 文本解析 语音合成 语音识别 文章输入 (机器) 语音理解 计算机处理 应答文生成 Ⅰ:第一类人机 语音通信问题 Ⅱ:第二类人机 语音通信问题 ○ Ⅰ 人与人之间的语音通信 Ⅱ 语音信号处理的目标就是实现人-人以及人-机间的无障碍信息流通 You can do it! 课程目标 初级目标:了解语音信号产生的基本机理;了解数字音频数据(包括语音)的常见格式及应用;掌握语音信号分析的基本原理、语音编码、语音识别、说话人识别、语音合成的原理及其实现过程。 高级目标: 能够 利用所学知识进行语音信号分析与处理 进阶目标: 能够 完成小型语音应用系统的设计开发 考核方式: 考核方式和评分: 考核形式 次数 评分比例 考核时间 平时作业 2 40 第6~8、11~14周 课堂专题讨论 1 第11~14周 期末综合性大作业 1 60 第15-18周 学习要求: 培养学生自主学习的能力。学生应在老师课堂教授的基础上,结合项目作业锻炼自己的资料查找与分析、信号采集与分析、简单系统设计、小组合作以及口头报告等综合能力。 辅助分析软件工具: MATLAB WaveSurfer http://www.speech.kth.se/wavesurfer/ VoiceBox http://www.ee.ic.ac.uk/hp/staff/dmb/voicebox/voicebox.html 语音识别系统开发工具 绪论:语音信号处理的一些基本概念 什么是语音信号处理? 语音信号处理简称语音处理,是以语音学和数字信号处理为基础而形成的一门综合性学科,处理的目的是要得到一些语音参数以便高效的传输或存储,或者通过信号处理以达到某种特定用途的要求,例如人工合成出语音,辨识出说话者,识别讲话的内容等。 语音的定义 语音是人类发音器官发出的、具有一定意义的、能起社会交际作用的声音。能够代表一定的意义,这是语言的声音(语音)同自然界其他一切声音的本质区别。 语音同它所代表的语义是相互依存的统一体,一方面,发音器官发出的声音必须同语义紧密结合、成为一定意义的代表,才能成为语音;另一方面,意义必须借助声音才能成为可被人感知、被人接受的东西,没有声音,意义便无法表达出来。 语音是一种具有多重属性的声音。首先,它同自然界其他声音一样,是由物体振动产生声波而形成的一种自然现象,所以它具有自然(物理)属性;语音又是人类的生理现象,发音是人体器官的动作,因此,它同时具有生理属性;作为语言这一特殊社会现象的物质基础,语音又具有社会属性,这是语音的本质属性。我们在分析语音现象的时候,这三种属性都会涉及到。 语音学 语音学是研究语音过程的科学,包括发音语音学、声 学语音学和听觉语音学三大分支。 发音语音学研究发音器官在发音过程中的运动和语音的音位特征; 声学语音学研究语音的物理属性,如语音声波的频率、振幅以及频谱特性等; 听觉语音学研究听觉和语音感知。 语音的属性—物理(声学)属性 物体由于某种外力的作用发生振动,并引起周围空气或其他媒介物质的振动,产生了振动波─ 声波,声波作用于耳鼓膜,使之产生同样的振动,刺激听觉神经,人就感觉到了声音。 语音也是这样产生、传递与接收的。 物理声学认为声波具有音高、音强、音长、音色四种要素,语音同样是这四种要素的统一体。 例:音高、音强、音长 声波频率 声压变化可以是周期性的和非周期性 频率概念 循环(cycle)- 压缩/稀薄过程 频率(frequency):每秒cycle数,单位 hertz (Hz) 周期 – cycle的持续时间 (1/frequency) 声音信号一般由许多频率不同的信号组成,称为复合信号;而单一频率的信号称为纯音信号。 频率范围 音频(Audio)信号 ---- 人的听觉器官能感知的声音,频率范围约为20Hz~20000Hz; 一般认为,语音信号中对于听音辨义最有用的频率成分在60-4000Hz之间,一般电话语音的频带在300-3400Hz之间。 次声波(subsonic) ---- 频率低于20Hz的信号; 超声波 (ultrasonic) ---- 频率高于20kHz的信号。 超声波及次声波一般不能引起人听觉器官的感觉,但可借助一些仪器设备进行观察和测量 语音的物理属性—音高 音高指声音的高低,它取决于发音体振动的快慢(频率)。发音体振动越快,发出的声音越高,反之声音则低。 频

文档评论(0)

a336661148 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档