- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语音用户界面设计简介
语音用户界面设计简介 VUI设计的定义及其重要性 VUI设计(Voice User Interface Design) ,即用户与语音应用系统的交互设计; VUI是直接面向用户的界面,是能否满足用户需求的关键,是系统能否成功的决定性因素之一; 优秀的VUI设计者不仅要对语音识别技术、市场需求、业务知识有深刻的理解,还需要具备一定的语言学及心理学的知识,了解用户的使用习惯和心理模型(Mental Model),从而设计出更符合用户的语音应用; 随着语音识别技术的应用,在国外,VUI设计已成为一门新兴的科学,而在国内,还未被广泛关注;讯飞很早就成立了专门的VUI设计团队,一直致力于此方面的研究及应用 语音用户界面设计简介 VUI设计的六个阶段 需求定义(Requirements Definition ):确定系统基本功能、理解目标用户群、理解业务上下文(Business Context) 概要设计(High-Level Design ):确定菜单框架、确定基本语法种类及范围、确定NVA(Nonverbal Audio)的使用、确定系统角色(Persona) 详细设计(Detailed Design ):完成所有对话流程及所有提示音的设计,形成规格说明书 开发(Development ):VoiceXML开发、动态语法开发等 测试(Testing ):包含功能性测试、识别测试,更关注可用性测试(Usability Tests ) 优化调整(Tuning ):通过分析呼叫数据及呼叫录音、进行用户体验调查等,从而进行对话优化、识别优化(识别参数及声学模型)、语法优化 语音用户界面设计简介 VUI设计核心原则 语音用户界面设计简介 低认知负载(Low Cognitive Load) VUI不同于GUI,声音对于人来说是短暂记忆( Short-term Memory ),用户很难记住太多的新信息,尽量减少提示音长度及新知识;建议每次给用户的新知识不要多,并且要在上下文相关的环境中进行 一般情况下,用户印象深刻的是最近听到的内容(End-Focus、Recency Effect ),例如比较下面两句话:“按一号键下载铃声,按二号键赠送铃声”、“下载铃声请按一号键,赠送铃声请按二号键” 设置用户的全局性操作(Constancy、Universal Command) 保持用户操作的一致性(Consistency) 语音用户界面设计简介 高效(Efficiency) 抓住用户的主要需求(试听下载),让用户快速达到自己的目标 系统支持语音识别的打断功能(Barge-in) 品牌音效(Branding)替换欢迎语,减少时间,并提升品牌效应 使用导航语(LandMark),让用户明确自己所处的位置;利用及时反馈(Direct Response),让用户及时了解自己的选择 区分新老用户,老用户的提示音更为简洁 尽量减少菜单个数(Menu Size),建议不要超过6个 尽量缩小菜单深度(Menu Depth),建议不要超过4层 语音用户界面设计简介 准确(Accuracy) 可支持按键方式,保证接收的准确性 支持近似结果的选择:N-Best Processing 利用识别置信度(Confidence Measures )来进行确认 正确设计识别语法,收录大量流行的歌手歌曲,提高语法覆盖率,从而提高准确率 识别命令字的构造(不要过短)建议长度在4字或5字 文字与声音的区别 文字:标点、粗细、大小、颜色、字体、特殊符号等; 声音的韵律(Prosody):包括强调(Stress)、声调(Intonation )、停顿(Pauses )、语速(Speed) 设计提示音时,大声读出来,并安排时间读给别人听 术语行话(Jargon)与大众化语言(坐席 vs. 人工服务;歌手列表 vs. 歌手姓名;铃音复制 vs. 铃音克隆) 注意避免各种歧义(中场 vs. 终场;任意键;替换 vs. 设置) 语音用户界面设计简介 柔和的错误恢复(Graceful Error Recovery) 一般情况下,只有当用户出现困难或者错误时,才会想到要寻求帮助;目前大部分语音应用系统都总是把主菜单的最后一个按键设置为帮助信息;我们建议把帮助信息融入到流程的上下文中,尤其是用户容易出错的地方; 错误种类一:提示音播完后用户3秒钟内都没有说话(或按键)(No-Speech Timeout):目前大部分系统采用重复播放同一个提示音的方式;我们建议主要采用延迟帮助 (Delay Help)的方式来提示用户如何操作,例如举例说明; 错误种类二:用户按键或识别错误( Reject 、No-Match),两者区别对待:对于按键,明确告知用户应该如何按键(例如:您按了其它键,请按1-5号键选择…);对
您可能关注的文档
- 设施农业设计基础第一节 湿空气的性质.pptx
- 讲课用 河流地貌的发育课件.ppt
- 设计“连接座”零件机械加工工艺规程及工艺装备课程设计说明书..doc
- 设施农业设计基础-温室控制系统.pptx
- 设施农业设计基础第二节 流体力学基础.pptx
- 设备组立要点.ppt
- 设计任务书-办公大楼-.doc
- 设计一台嵌入式CISC模型计算机.doc
- 设计互提条件单.doc
- 设计PPT制作指南.pptx
- 2025年智能快递驿站行业政策与市场机遇报告.docx
- 2025年校园安全防范中新能源电动巡逻车采购可行性分析.docx
- 2025年智能垃圾分类智慧监管平台在智慧旅游区的应用前景研究.docx
- 2025年智能家居报告:人工智能伦理风险的法律责任与用户隐私保护.docx
- 2025年智能垃圾分类与垃圾分类信息化管理结合的可行性研究.docx
- 2025年智慧社区远程医疗诊断中心在基层医疗机构运营管理中的应用报告.docx
- 2025年智慧社区:老年活动广场智能化升级研究.docx
- 2025年智能社区新能源电动巡逻车市场应用前景分析报告.docx
- 2025年智能垃圾分类智慧监管平台在垃圾分类回收与处理中的智能化改造路径.docx
- 2025年本土半导体材料产业链国产化战略布局报告.docx
文档评论(0)