PerceptionofLanguage语音识别讲解.ppt

下载文档 降价啦

33
0
约1.08万字
约 40页
2017-03-24 发布于湖北
举报
版权申诉
保障服务

PerceptionofLanguage语音识别讲解.ppt

1、本文档共40页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

Perception of Language Content 2.1 Three problems of speech discrimination 2.2 Methods of speech discrimination 2.3 the structure of speech 2.4 perception of isolated speech segments 2.5 Perception of continuous Speech 2.6 Perception of Written Language? 2.1Three problems of speech discrimination? Discussion 言语听辨过程并不复杂。我们按时间顺序听到的是一系列的词，而这些词又是一系列声音组成的。这些声音相当于音位分段按一定的次序出现。因此，在语言的听辨中，我们是按音素出现的次序依次处理的。如：在听辨cat 时，先是听到辅音[k]，然后是元音 [?]，最后是辅音[t]。因此，只要我们把语音切分成音素后，我们就从最小的单位开始，逐级听辨出词素、词、短语、子句、句子、语段。当我们说话的时候，我们的发音是流畅而连续的，听话人不大可能把它切分成分离的声音单位。在词与词、句与句之间好像是有停顿的，在音段之间好像是有界限的，但是在实际上却不是很明显。如：如果我们按言语的声音写下来： spokenwordsarenotseperatedbyspaceslikewordsareinprint. spoken words are not seperated by spaces like words are in print. 对言语听辨的研究者来说，人们怎样从复杂的言语信号中孤立（切分）出个别声音，并进而听辨，始终是一个值得研究的问题。 2.1.1 音段的辨认? 如果语言的每一个声音都能够和一个标准的形式相联系，那么建立言语感知过程模型就比较简单。然而，由于种种原因，语音并没有不变式或标准的形式。（1）同一个音段的产生往往视其所出现的语境（Context-consitioned Variation)有所不同。在bill, ball, bull, able, rob 这几个词中的b，发音受到后面元音的影响而略有差异。因此，我们不能把音素看成是一条链条上的珠子，一个音素的声音接着另一个音素的声音。我们没有办法把言语信号切分成单一的、只表示一个音素的所有特征又不表示另一个音素的任何特征的音段。（2）性别、年龄、场合也会导致发音的不同。男、女性，大人、小孩因声带的大小和配置不同发出的元音有明显差异；我们自己产生的语音在不同场合也不是完全一样的，言语听辨研究必须解释人们为什么在处理有差异的言语信号时那么轻而易举。（3）言语信号的差异来自言语速度很快地口语。在流利的口语中，言语音段的声音特征被消弱，变化很大。言语听辨的研究必须解释听话人是怎样处理这些“凌乱的”语言样本的。 2.1.2 “缺乏不变式”的问题? 口头会话的声音特征变化很大。有些时候说话人在说话时发音不足（underarticulate),即失去发音目标，以致词语丢失了它们大部分的信息。但是听话人通常对言语的理解仍然不会有任何困难。言语听辨模型需要解释语言处理不同层面（词汇、语法、语境）的知识怎样帮助言语理解。 2.1 3言语在不理想环境中的听辨? 2.2 言语听辨的研究手段 Willis(1829) 和 Helmholtz(1859)在19世纪就开始研究声音的物理性能，但是研究人怎样感知语言是在第二次世界大战前才展开。 20世纪中叶才具备了研制研究言语听辨的仪器的技术。 vocoder（声音记录仪），把言语分析和记录为更简单的信号，传递少一点的信息。 sound spectrograph(声音摄谱仪），按照声音的分布来分析语音信号，用y轴表示频率，x轴表示时间，用标记的深浅来表示振幅（amplitude）。声音摄谱仪的出现是言语研究的里程碑，因为语音学家第一次可以通过简单而又花费不多的手段获得范围广阔的，客观而量化的语音信息。 50—60年代，研究中心是声学语音学（acoustic phonetics) 70年代，研究的兴趣转为发音语