- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
用声音去沟通VUI(VoiceUserInterface)
info@
语音识别芯片LD3320 高阶秘籍
Update@2011 年10 月13 日
语音识别芯片/声控芯片
单芯片/非特定人/动态编辑识别列表
语音识别解决方案
用声音去沟通
VUI (Voice User Interface)
ICRoute 用声音去沟通
VUI (Voice User Interface)
Web :
Tel : 021
Mail: info@
第 1 页
info@
简介:3
一、 在识别精度要求高的场景中,使用“触发识
别”模式3
二、 增添“垃圾关键词语”——吸收错误识别3
三、 口令触发模式4
四、 巧妙运用关键词语的ID5
五、 工作电压5
六、 用拼音标注外文或者方言5
七、 对于同一关键词ID 设置多个习惯发音6
八、 调节语音结束后得到识别结果的反应时间6
九、 麦克风,相关寄存器设置与识别效果和距离..8
十、 语音识别用户使用模式详析 11
第 2 页
info@
简介:
基于语音识别芯片 LD3320 开发产品,可参考《LD3320 开发手册》。为了
提高终端用户对于语音识别的主观体验,本文总结了一些高阶的方法和窍门,
集结成文,与大家共享。
本文档会不定期更新,及时汇总实战中的经验。敬请期待。
一、在识别精度要求高的场景中,使用“触发识
别”模式
关 于 LD3320 的两 种 使用 模式, 可 以参 考网站 介 绍 :
/web_cn/LD332X_UserModel.html 。
在识别精度要求高的场景中,应该采用“触发识别”模式。原因是:
1) 用户在每次按热键后,精神处于最集中的状态,此时用户说的语音
命令会比较认真,清晰。避免了用户过于随意的发音导致的识别误
差。
2) 每次按热键后,产品应该给以一个明显的开始信号,比如发出
“当”的一声或者其他提示信号,可以给用户一个明确开始的提
示,方便用户掌握说语音命令的时间。
3) 由于按键触发后,用户就会贴近麦克风并说出语音命令,避免了其
他环境声音被录入LD3320 芯片导致的误识别。
另:这种方式还是一种省电的方式,在不识别时,彻底不让芯片工作以省电。
二、增添“垃圾关键词语”——吸收错误识别
在设定好要识别的关键词语后,为了进一步降低误识别率,可以再添加一
些其他的任意词汇进识别列表,用来吸收错误识别,从而达到降低误识别率的
目的。
可以把这些关键词语称之为“垃圾关键词语”。
比如,某个应用场景中,需要识别的关键词语是 4 条,“前进”,“后
退”,“开门”,“关门”。在把这4 个关键词语设置进LD3320 后,可以再另
外设置 10~30 个词语进 LD3320,比如“前门”,“后门”,“阿阿阿”,“呜
呜”等等。
第 3 页
info@
只有识别结果是 4 个关键词语之内的,才认为识别有效。如果识别结果是
“垃圾关键词语”,则说明是其他的声音导致的误识别,产品应该重新开始一
次识别过程。
这样,可以非常非常有效地降低误识别率。极大地提高终端用户
文档评论(0)