多媒体计算机技术4节.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音识别单元的选取 选择识别单元是语音识别研究的第一步 语音识别单元有单词(句)、音节和音素三种 单词单元广泛应用于中小词汇语音识别系统 音节单元多见于汉语语音识别 音素单元以前多见于英语语音识别的研究中,但目前中、大词汇量汉语语音识别系统也在越来越多地采用 语音识别技术及应用 ?语音识别的发展历史 ?语音识别技术 语音识别系统的类型 语音识别的应用 语音识别系统的类型 语音识别系统有以下几种分类方式: 根据对说话人的依赖程度可以分为特定人和非特定人语音识别系统 根据对说话人说话方式的要求,可以分为孤立字(词)语音识别系统,连接词语音识别系统以及连续语音识别系统 根据词汇量大小,可以分为小词汇量、中等词汇量、大词汇量以及无限词汇量语音识别系统 特定人语音识别系统 特定人的识别系统精明得足以能了解讲话者的语音特点,它从语音签名上就能知道讲话者的身份。 只有在讲话者用特定单词组形成的词汇表训练系统后,它才能识别 特定人系统的优点是它是可训练的,系统很灵活,可以训练它来识别新词 特定人的系统的缺点是由一个用户训练的系统不能被另一用户使用 例:手机中使用的语音拨号 非特定人语音识别系统 非持定人识别系统可识别任何用户的语音。它不需要任何来自用户的训练,因为它不依赖于个人的语音签名。 为生成非特定人识别系统、大量的用户训练了大词汇表的识别器。 在训练系统时,男声和女声、不同的口音和方言,以及带有背景噪音的环境都计入了考虑范围之内以生成参考模板。 例:IBM Via Voice 孤立词语音识别系统 孤立词(语音)识别系统,一次只提供一个单一词的识别 识别器的第一个任务是进行幅度和噪声归一化,下一步是参数分析 可以通过把对应于一个词的大量样本聚集为单一群来获得非特定人孤立单词语音识别器。 连接词语音识别系统 连接词的语音由所说的短语组成,而短语又是由词序列组成 识别连接词短语中单词的一种方法是采用词定位技术 类似于孤立词语音识别,连接词语音识别用于命令和控制应用 连续语音识别系统 连续语音由在听写中形成段落的完整句子组成 连续语音识别系统可以分成下列三部分: 第一部分包括数字化、幅度归一化、时间归一化和参数表示 另一部分包括分割并把语音段标记成在基于知识或基于规则系统上的符号串 最后一部分是设计用于识别词序列而进行语音段匹配 语音识别技术及应用 ?语音识别的发展历史 ?语音识别技术 ?语音识别系统的类型 语音识别的应用 语音识别的应用 语音邮件集成 数据库输人和询问应用 语音命令和控制应用 第四讲 数字语音处理技术 ?数字音频压缩技术 ?三维音效 ?语音识别 自然语言理解 语音合成 自然语言理解 自然语言理解就是研究如何能让计算机理解并生成人们日常所使用的(如汉语、英语)语言,使得计算机懂得自然语言的含义,并对人给计算机提出的问题,通过对话的方式,用自然语言进行回答。目的在于建立起一种人与机器之间的密切而友好的关系,使之能进行高度的信息传递与认知活动。 用自然语言与计算机进行通信,这是人们长期以来所追求的。 自然语言理解 一个中文文本从形式上看是由汉字(包括标点符号等)组成的一个字符串。由字可组成词,由词可组成词组,由词组可组成句子,进而由一些句子组成段、节、章、篇。 无论在上述的各种层次:字(符)、词、词组、句子、段,……还是在下一层次向上一层次转变中都存在着歧义和多义现象,即形式上一样的一段字符串,在不同的场景或不同的语境下,可以理解成不同的词串、词组串等,并有不同的意义。 自然语言处理的核心技术是语言分析技术,即将句子(数量无限)变换成由词语(数量可控)及其抽象形式(数量有限)构成的用某种数据结构(句法树、复杂特征集或语义网络)表示的内部形式(数量有限)。 自然语言理解 语言分析技术可以分为基于规则与基于统计数据两大类。 概率语法通过语料库统计给每条语言规则加上概率值,语言规则便有了“柔性”,不再是“说一不二”、“非此即彼”。 概率语法是有机结合这两类技术的较好理论体系。为了完成这种统计,事先必须按照人给出的语言规则加工语料库(至少要加工一部分训练语料),这说明统计方法也需要规则的指导。两者之间的结合和互相利用是必然的趋势。 自然语言理解 语言分析可以划分为词法析、句法分析、语义分析、篇章分析等步骤。现在,词法分析和句法分析相对成熟,语义分析逐渐成为研究重点。对象单元由小到大从句子向篇章发展。实际上只有在篇章的范围内分析,省略、指代和句子的固有歧义等问题才可能解决。 如果说自然语言处理技术尚未取得重大突破,其含义就是完整语言分析技术尚未过关。 浅层分析技术或者只提取句子中的名词短语,或者只识别句子的谓语中心词及其他组块同谓语中心词的依存关系。

文档评论(0)

精品课件 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档