语音信号与图像处理知识点 .pdfVIP

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

语⾳信号与图像处理知识点

⼀、语⾳、语⾳信号处理的名词解释

1、语⾳:是语⾔的声学表现,是声⾳和意义的结合体,是相互传递信息的重要⼿段,是⼈类最重要、最有效、最常⽤和最⽅

便的交换信息的形式。

2、语⾳信号处理:是研究⽤数字信号处理技术对语⾳信号进⾏处理的⼀门学科,它是⼀门新兴的学科,同时⼜是综合性的多

学科领域和涉及很⼴的交叉学科。它与语⾳学、语⾔学、声学、认知科学、⽣理学、⼼理学有密切关系。

⼆、语⾳学的名词解释

语⾳学:是研究⾔语过程的⼀门科学,它包括三个研究内容:发⾳器官在发⾳过程中的运动和语⾳的⾳位特性;语⾳的物理特

性;以及听觉和语⾔感知。

§1.2语⾳信号处理的发展概况

1、语⾳编码:语⾳编码技术是伴随着语⾳信号的数字化⽽产⽣的,⽬前主要应⽤在数字语⾳通信领域。

2、语⾳合成:语⾳合成的⽬的是使计算机能像⼈⼀样说话。

3、语⾳识别:语⾳识别是使计算机判断出所说的话得内容。

§2.2语⾳产⽣的过程

⼀、语⾳、清⾳、浊⾳

1、语⾳:声⾳是⼀种波,能被⼈⽿听到,振动频率在20Hz-20kHz之间。语⾳是声⾳的⼀种,它是由⼈的发⾳器官发出的、

具有⼀定语法和意义的声⾳。语⾳的振动频率最⾼可达15kHz左右。

2、浊⾳、清⾳:语⾳由声带振动或不经声带振动来产⽣,其中由声带振动产⽣的⾳统称为浊⾳,⽽不由声带振动产⽣的⾳统

称为清⾳。浊⾳中包括所有的元⾳和⼀些辅⾳,清⾳包括另⼀部分辅⾳。⼆、语⾳的产⽣过程:空⽓从肺部排出形成⽓流。空

⽓通过声带时,如果声带是紧绷的,则声带将产⽣张弛振动,即声带周期性地开启和闭合。声带开启时,空⽓流从声门喷射出

来,形成⼀个脉冲;声带闭合时相应于脉冲序列的间歇期。

语⾔交际:通过连接说话⼈⼤脑的⼀连串⼼理、⽣理、和物理的转换过程实现的。这个过程包括:发⾳-传递-感知。因此现代

语⾳的三个分⽀:发⾳语⾔学、声学语⾔学、听觉语⾔学。

三、基⾳周期、基⾳频率

基⾳周期:声带开启和闭合⼀次的时间即振动周期称为⾳调周期或基⾳周期。

基⾳频率:基⾳周期的倒数称为基⾳频率,简称为基频。

四、浊⾳、清⾳、爆破⾳的激励源

对于浊⾳、清⾳和爆破⾳来说,激励源是不同的,浊⾳语⾳是位于声门处的准周期脉冲序列,清⾳的激励源是位于声道的某个

收缩区的空⽓湍流,⽽爆破⾳的激励源是位于声道某个闭合点处建⽴起来的⽓压及其突然释放。

五、共振峰的概念(参见⼤纲)

1、共振峰名词解释:声道是⼀个分布参数系统,它是⼀个谐振腔,有许多谐振频率,称为共振峰,它是声道的重要声学特

征。

2、共振峰的公式:Fn=(2n-1)c/4L(会运⽤公式进⾏计算,填空、选择)

3、谐振点间的间隔不同,但平均仍然⼤约为每1KHz有⼀个谐振点。

4、声道的共振峰特性决定所发声⾳的频谱特性(⾳⾊)。

5、头三个共振峰最重要。

⼀、语⾳的物理属性(集中备课)

语⾳的物理性质包括⾳质、⾳调、⾳强、⾳长等特性。语⾳是⼈的发⾳器官发出的⼀种声波,具有声⾳的物理属性。⾳质是⼀

种声⾳区别于其他声⾳的基本特征;⾳调指声⾳的⾼低,取决于声波的频率:频率⾼则⾳调⾼,频率低则⾳调低;响度是指声

⾳的强弱,⼜称⾳量,它是由声波震动幅度决定的;声⾳的长短也称⾳长,它取决于发⾳持续时间的长短。

⼆、⾳素、⾳节、单词、句⼦的基本概念以及它们之间的关系(集中备课)

(1)⾳素是语⾳的最⼩、最基本的组成单位,⾳素都有其独⽴的各不相同的发⾳⽅法和发⾳部位,它是使听者能区别⼀个单

词和另⼀个单词的声⾳的基础。

(2)⾳节是最⼩的语⾔⽚段,⼀个⾳节由⼀个或⼏个⾳素组成。

(3)单词是由⾳节结合⽽成的更⼤单位,是有意义的语⾔的最⼩单位。

(4)句⼦是单词的进⼀步组合。

三、汉语的特点是:⾳素少、⾳节少。

汉语中的⾳节即字⾳由声母、韵母和声调按⼀定⽅式构成,即声、韵、调三个因素构成。

四、语⾳频谱特性其中虚线称为谱包络,其形状是由H(f)和G(f)的包络乘积得到的。

五、清⾳和浊⾳的频谱特性

清⾳和浊⾳的波形有很⼤的不同。清⾳的波形类似于⽩噪声,具有很弱的振幅;元⾳(浊⾳)具有明显的准周期性,并具有较

强的振幅。它们的周期对应的频率就是基⾳频率。如果考察其中⼀个周期,还可以⼤致看出其频谱特性。

§2.4语⾳信号产⽣的数学模型

⼀、语⾳信号的数字模型(集中备课)

1、语⾳信号数字模型的概念:语⾳信号被看成是线性时不变系统(声道)在随机噪声或准调周期脉冲序列激励下的输出。

2、语⾳信号的产⽣模型P16(重点注意)

⼆、发不同性质的⾳时,激励的情况是不同的,⼤致分为两类:(1)发浊⾳时,此时⽓流在通过绷紧的声带时,冲激声带产

⽣振动,使声门处形成准周期性的脉

文档评论(0)

166****6209 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档