用声音去沟通VUI(VoiceUserInterface).PDF

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
用声音去沟通VUI(VoiceUserInterface)

info@ 语音识别芯片LD3320 高阶秘籍 Update@2011 年10 月13 日 语音识别芯片/声控芯片 单芯片/非特定人/动态编辑识别列表 语音识别解决方案 用声音去沟通 VUI (Voice User Interface) ICRoute 用声音去沟通 VUI (Voice User Interface) Web : Tel : 021 Mail: info@ 第 1 页 info@ 简介:3 一、 在识别精度要求高的场景中,使用“触发识 别”模式3 二、 增添“垃圾关键词语”——吸收错误识别3 三、 口令触发模式4 四、 巧妙运用关键词语的ID5 五、 工作电压5 六、 用拼音标注外文或者方言5 七、 对于同一关键词ID 设置多个习惯发音6 八、 调节语音结束后得到识别结果的反应时间6 九、 麦克风,相关寄存器设置与识别效果和距离..8 十、 语音识别用户使用模式详析 11 第 2 页 info@ 简介: 基于语音识别芯片 LD3320 开发产品,可参考《LD3320 开发手册》。为了 提高终端用户对于语音识别的主观体验,本文总结了一些高阶的方法和窍门, 集结成文,与大家共享。 本文档会不定期更新,及时汇总实战中的经验。敬请期待。 一、在识别精度要求高的场景中,使用“触发识 别”模式 关 于 LD3320 的两 种 使用 模式, 可 以参 考网站 介 绍 : /web_cn/LD332X_UserModel.html 。 在识别精度要求高的场景中,应该采用“触发识别”模式。原因是: 1) 用户在每次按热键后,精神处于最集中的状态,此时用户说的语音 命令会比较认真,清晰。避免了用户过于随意的发音导致的识别误 差。 2) 每次按热键后,产品应该给以一个明显的开始信号,比如发出 “当”的一声或者其他提示信号,可以给用户一个明确开始的提 示,方便用户掌握说语音命令的时间。 3) 由于按键触发后,用户就会贴近麦克风并说出语音命令,避免了其 他环境声音被录入LD3320 芯片导致的误识别。 另:这种方式还是一种省电的方式,在不识别时,彻底不让芯片工作以省电。 二、增添“垃圾关键词语”——吸收错误识别 在设定好要识别的关键词语后,为了进一步降低误识别率,可以再添加一 些其他的任意词汇进识别列表,用来吸收错误识别,从而达到降低误识别率的 目的。 可以把这些关键词语称之为“垃圾关键词语”。 比如,某个应用场景中,需要识别的关键词语是 4 条,“前进”,“后 退”,“开门”,“关门”。在把这4 个关键词语设置进LD3320 后,可以再另 外设置 10~30 个词语进 LD3320,比如“前门”,“后门”,“阿阿阿”,“呜 呜”等等。 第 3 页 info@ 只有识别结果是 4 个关键词语之内的,才认为识别有效。如果识别结果是 “垃圾关键词语”,则说明是其他的声音导致的误识别,产品应该重新开始一 次识别过程。 这样,可以非常非常有效地降低误识别率。极大地提高终端用户

文档评论(0)

ldj215322 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档