用声音去沟通VUI(VoiceUserInterface).PDF

下载文档

158
0
约1.34万字
约 14页
2017-05-31 发布于江苏
举报
版权申诉
保障服务

用声音去沟通VUI(VoiceUserInterface).PDF

1、本文档共14页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

用声音去沟通VUI(VoiceUserInterface)

info@ 语音识别芯片LD3320 高阶秘籍 Update@2011 年10 月13 日语音识别芯片/声控芯片单芯片/非特定人/动态编辑识别列表语音识别解决方案用声音去沟通 VUI (Voice User Interface) ICRoute 用声音去沟通 VUI (Voice User Interface) Web : Tel ： 021 Mail: info@ 第 1 页 info@ 简介：3 一、在识别精度要求高的场景中，使用“触发识别”模式3 二、增添“垃圾关键词语”——吸收错误识别3 三、口令触发模式4 四、巧妙运用关键词语的ID5 五、工作电压5 六、用拼音标注外文或者方言5 七、对于同一关键词ID 设置多个习惯发音6 八、调节语音结束后得到识别结果的反应时间6 九、麦克风，相关寄存器设置与识别效果和距离..8 十、语音识别用户使用模式详析 11 第 2 页 info@ 简介：基于语音识别芯片 LD3320 开发产品，可参考《LD3320 开发手册》。为了提高终端用户对于语音识别的主观体验，本文总结了一些高阶的方法和窍门，集结成文，与大家共享。本文档会不定期更新，及时汇总实战中的经验。敬请期待。一、在识别精度要求高的场景中，使用“触发识别”模式关于 LD3320 的两种使用模式，可以参考网站介绍： /web_cn/LD332X_UserModel.html 。在识别精度要求高的场景中，应该采用“触发识别”模式。原因是： 1）用户在每次按热键后，精神处于最集中的状态，此时用户说的语音命令会比较认真，清晰。避免了用户过于随意的发音导致的识别误差。 2）每次按热键后，产品应该给以一个明显的开始信号，比如发出 “当”的一声或者其他提示信号，可以给用户一个明确开始的提示，方便用户掌握说语音命令的时间。 3）由于按键触发后，用户就会贴近麦克风并说出语音命令，避免了其他环境声音被录入LD3320 芯片导致的误识别。另：这种方式还是一种省电的方式，在不识别时，彻底不让芯片工作以省电。二、增添“垃圾关键词语”——吸收错误识别在设定好要识别的关键词语后，为了进一步降低误识别率，可以再添加一些其他的任意词汇进识别列表，用来吸收错误识别，从而达到降低误识别率的目的。可以把这些关键词语称之为“垃圾关键词语”。比如，某个应用场景中，需要识别的关键词语是 4 条，“前进”，“后退”，“开门”，“关门”。在把这4 个关键词语设置进LD3320 后，可以再另外设置 10~30 个词语进 LD3320，比如“前门”，“后门”，“阿阿阿”，“呜呜”等等。第 3 页 info@ 只有识别结果是 4 个关键词语之内的，才认为识别有效。如果识别结果是 “垃圾关键词语”，则说明是其他的声音导致的误识别，产品应该重新开始一次识别过程。这样，可以非常非常有效地降低误识别率。极大地提高终端用户