1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
DSP4

* 搜集到各个滤波器的响应强度,就可生成关于一个发音的数据矩阵。在训练中,同一个词会重复若干次并产生若干这样的矩阵。可以把这些矩阵的平均当做所研究单词的模板或代表。在语音识别器的词汇表中,每个单词都有一个对应的模板。当需要识别一个新的发音时,也为它生成一个数据矩阵。将这个矩阵与模板矩阵进行比较的一个简单的方法是计算二者之间的“距离”。图14.19解释了这种方法。这种方法与求两个(x,y)坐标组之间的距离类似。在图14.19所示的例子中,每个单词被分成三个时间间隔,滤波器组由三个滤波器组成,这样,单词就可由一个3×3的矩阵表示。如图所示,矩阵之间的距离是由矩阵所有对应元素差值的平方和的平方根计算的。对于实际的单字识别,3×3矩阵是不合适的。以适当的精度识别一个小的词汇表,16个时间间隔和16个滤波器才够用。 * 对于连续语音识别,此时词的边界是不容易确定的,可以把滤波器组加于重叠的语音段上。停顿或弱的间隔不能很好地识别词的边界,因为它们可能出现在某些声音和词的中间,如图14.21所示。图中的信号轨迹和频谱都显示出瞬息的弱音,尽管事实上讲的是单个词“bottleneck”。 * 要从数以千计可能的词中识别出一个词是很困难的工作。为了提高识别正确词的机会,许多识别器使用某种形式的语法模型以帮助缩小选择面。例如,在图14.23给出的句子中,猜出丢失的词相对来说是容易的。类似地,当单词“The”,“quick”和“red”已经被成功识别出来时,接下来的词的类型极有可能是一个名词,“The quick red smiled”或“The quick red and”不太可能出现在通常的语句中。识别器在任何时刻所必须考虑的单词总数称为它的困惑度(perplexity)。语法结构的知识可以帮助降低困惑度。最后,某些识别器与所识别的词一起提供出所选择词正确的概率。当与发音最接近的模板仍有相当的距离时,发音被正确识别的机会很小:问题可能是模板词汇表中没有这个词。 * DSP技术的应用促进了连续语言识别技术的发展。当前最先进的技术可以提供实时或接近实时的识别速度,意味着语音识别与语音生成一样快。典型的差错率在5%到15%之间。词汇量可达70 000个单词,困惑度通常不超过250。关键词定位(keyword spotting),即在正常语流中寻找少数几个关键词,已应用于话务员服务,以帮助提高服务质量。ATT的“How May I Help You?”服务则更进一步:它使用了一个复杂的语言理解系统,该系统允许通话者用十几种不同的方式问同一个问题,而仍能接收到正确的信息。许多话务员的工作正在以这种方法自动完成。当然,公共电话网的语音识别系统必须可靠,而且是独立于发音者的。其他应用包括语音汽车出租、机票预定以及医学或法律的记录。 现在,语音一文本转换系统已经广泛地应用于家庭。为了实现大词汇量的连续语音识别,大多数记录系统需要某种类型的训练阶段,以提高模板质量从而提高识别率。语音识别系统有助于防止电话卡、蜂窝电话、银行服务中的欺诈行为。语音动作控制已应用在某些飞机、汽车和轮船上,尽管大部分重要的操作还是通过人工或计算机控制的。因为在紧张时,驾驶员的语音特性会改变,从而降低关键时刻的识别精度。 * 这个简单的系统所生成的语句非常易于理解,但真实的声音感不够。当然所录入的短语是自然语音高质量的复制,但是记录之间的过渡却很不自然。在自然语音中,单词交界处的声音倾向于混合在一起,而简单的语音合成器不能捕捉到它们。 * 油田的勘察 利用声音在不同媒介的传播速度的不同而确定不同的岩石层 * 在每个迁跃处都计算反射系数。对于所标示的跃迁,在一个方块中速度是v1=2 404.2 m/sec,在下一个方块中v2=2 444.8 m/see。反射系数是0.008 4。当从一个方块到下一个方块速度下降时,反射系数是负值。 * 第14章 信号处理的应用 * 表示图14.37中的地震波数据需要大量的幕后处理。执行勘测任务的船后面拖曳着几十个地震检波器并且在勘测期间不停地运动。因此,一个特定位置的特征将在许多不同时间被许多不同的地震检波器记录,如图14.41所示。而且,路程越长,衰减就越大。 图14.41中的脉冲都对应于来自同一特征的反射。必要时要对它们重新对准、放大并且加在一起,以给出地震波截面图上的一条垂直轨迹。 第14章 信号处理的应用 * 图14.41为地震波截面图修正地震检波器数据 第14章 信号处理的应用 * 甲板勘测可以提供一些关于海底下面沉积物成分的有用信息。遗憾的是,由于垂直轴是时间而不是深度,因此主要特征不容易映射到海底下面的绝对位置。那些重要特征的深度只有通过对地震波数据与钻井数据的比较才能得到。然而,像图14.36中的那些由钻井得到的反射系数不能

文档评论(0)

little28 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档