网站大量收购独家精品文档,联系QQ:2885784924

实用家电语音控制系统设计.pdfVIP

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
自动化与仪器仪表 实用的家电语音控制系统的设计 1 2 1 1 戴海生 ,朱小燕 ,罗予频 ,杨士元 清华大学 自动化系 北京 清华大学 计算机系 北京 ) (1. , 100084;2. , 100084 摘 要:家电语音控制系统在复杂的背景环境下,由于识别率显著下降而导致关键词检出率偏低。 介绍了利用孤立词、连接词以及连续语音识别引擎构造的多识别引擎的识别器,该识别器允许用户自 由选择语音输入方式,扩大了关键词的检出范围,从而达到提高关键词检出率的目的。同时给出了家电 语音控制系统的整体结构,分析了影响系统性能的关键因素,并且给出了相应的解决方案。 关键词:语音识别 家电语音控制 语音确认 关键词检出 近年来,随着语音识别与确认技术的逐渐成熟,基 检出的关键词及其对应的确认分值产生相应的对话或 于语音识别技术的对话控制系统受到了越来越多的关 者控制命令对硬件进行控制,同时利用已经确认的语音 注。现有的语音技术虽然在实验室环境中取得了较好的 对识别器中的语音模型进行更新。图 1给出了家电语音 识别效果,但是一旦由于环境或者说话人的客观原因使 控制系统的结构图。 得语音信号变差时,就会导致系统检出率急剧下降,从 2基于多识别引擎的识别器设计 而使得语音控制系统的性能变差甚至不能正常工作。 2.1传统识别引擎简介 针对残疾人行动不便的问题,在 日本富士通公司的 根据待识别语音属于单一用户还是公众进行分类, 资助下开发了一套残疾人利用语音进行家电控制的系 可以将其分为特定人识别以及非特定人识别。由于设计 统。本系统的用户主要是康复中心的特殊用户,由于身 目标是针对特定用户的,因此采用特定人识别器。如果 体长期瘫痪或者其它原因,他们不仅行动不便,而且语 根据输入语音特点以及建模方法进行分类,当前的识别 言交流能力也有很大程度的下降,尤其是发音不够清晰 引擎主要分为孤立词识别、连续语音识别以及连接词识 准确,仅仅用传统的语音识别器很难满足控制系统实际 别等引擎。下面分别介绍几种不同的识别引擎以及各自 应用的需要。因此,提出了综合利用孤立词识别器、连接 的优缺点。 词识别器以及连续语音识别器构建一个基于多识别引 2.1.1孤立词识别引擎 擎的识别器的方法,使得关键词被正确检出的可能性大 由于孤立词识别引擎的输入是孤立的词汇,因此其 大增加,在允许用户 自由使用孤立或者连续语音交流的 识别范围小,建模精确,识别率高,非特定人的孤立词识 同时,还最大限度地利用不同识别引擎的优点,改善了 别引擎的识别率可达 95%左右,特定人的识别率甚至可 家电语音控制系统的性能。 达 99%以上。但是孤立词识别引擎要求用户的输入必须 另外,还分析了语音控制系统中确认、模型 自适应 是一个个独立的单词,显然对于连续的语音流无法处 以及对话控制策略等关键技术,并且给出了相应的解决 理。即使是独立的单词,如果由于用户的习惯或者生理 方案,从而给出了家电语音控制系统的完整结构,在电 原因,在语音中含有一些语气词或者其它高能量的突发 梯、轮椅、电视等设备的实际控制中取得了良好的效果。 1家电语音控制系统的结构 家电语音控制系统包括软件设计和硬件设计两部 分。本文主要讨论软件设计部分,其中包括:语音识别模 块、语音确认模块、对话控制及硬件指令传输模 块以及模型自适应模块。整个系统的流程是:首 先,用户的语音被送入语音识别模块进行 Viterbi 解码识别,得到相应的候

文档评论(0)

youyang99 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档