- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《人机交互论文-语音与听觉界面》
摘要随着数字化及智能化的普及,在日常生活及工作中,我们随处可以见到一些语音与听觉系统的应用,像公交车的语音报站系统、语音邮件系统、手机的语音命令拨打电话等等,都是这样的应用。那么,本文就现阶段的一些语音与音频技术,包括离散词语识别、连续语音识别、语音信息系统、语音生成、非语音听觉交互五种,针对每一类技术各自的应用领域、优缺点及其发展趋势进行了详细地探讨、分析。最后,整体总结分析了语音与听觉界面当前的发展及其未来发展趋势。关键词:语音与听觉界面;离散词语识别;连续语音识别;语音信息系统;语音生成;非语音听觉界面引言对计算机讲话和让计算机说话的梦想已经诱惑了很多研究人员及幻想家。1968年,Arthur C. Clarke 在《2011:星际漫游》的书和电影中对HAL 9000 计算机的幻想,已经为科幻小说中计算机的性能和一些高级开发人员设定了标准。虽然硬件设计人员已经在语音识别、生成和处理方面取得了引人注目的进步,但是与科学小说的幻想相比,当前的成功仍是令人清醒的。那么在现阶段,语音与听觉交互到底有着怎么样的发展呢?在哪些领域进行的了应用呢?应用的效果怎么样呢?优势与劣势各是什么呢?针对上述这些问题,语音与听觉交互的发展趋势又会是怎样呢 ?这些都是本文将要讨论的问题。语音与听觉界面通俗易懂的讲,语音交互是要实现对计算机讲话和让计算机讲话。目前语音交互取得了很多进展,但是仍然存在着很多不能忽视的问题。总的来讲,语音交互的实际应用只有在他们适合用户的工作速度快,认知负载底,出错率低的需要时才会成功。从这些需求来看,语音交互似乎都不能很好地满足用户的需要,原因是:首先,语音输出是相对缓慢的;其次,与手眼协调相比,语音命令对用户工作记忆的要求更高,对正在执行任务的用户影响更大,比如计划和问题求解便是这样的;最后,背景噪声和用户语音的变体对语音识别的挑战仍旧很大,使得语音的识别的出错率还是占有一定的比重。尽管语音交互存在着这么多不能忽视的,不尽如人意的问题,语音交互仍有以下一些方面的优点:①语音存储转发和语音生成可预测、低成本、广泛可用。②对于有身体缺陷者,语音有明显好处。③电话会话的及时性和情感影响是人与人之间交流中引人瞩目的组成成分。语音和音频技术有五种:离散词语识别、连续语音识别、语音信息系统、语音生成、非语音听觉交互。接下来,就从这五个具体方面,解析语音交互的优点与缺点,及可能的发展趋势。2.1离散词语识别离散词语识别设备识别特定人所说的单个词,对于100~10000 UI)》中所说,“我们认为下一个推动计算机新时代到来的最关键的技术之一,应该是语音和通用的用户界面技术,这一技术可以使用户在任何地方、任何时候都能够获得信息,控制计算机。”[3],语音用户界面的优势便是操作简洁性,因为键盘鼠标这些设备并不是在任何场景下都可以使用的。所以印证了语音界面在嵌入式领域可以大有作为这样一个观点。就我个人的观点并结合文章所述,语音交互的两个重要问题,一是识别率低,二是占用用户工作记忆。我觉得可以通过下列的思路来考虑:(1)在这些特定领域可以使用一些技巧来增加识别率降低错误率,比如通过自我学习与积累在一个领域中可能使用到的语法库、词语库、句子库的方法,使得语音的识别变得专项起来,那么在这个领域的语音识别率就会大大提高。(2)除了语音的识别率低,另外语音的使用会占用用户的工作记忆的问题,就如前面所说,可以通过手动操作与语音操作结合起来的办法来克服,通过结合的办法就可以充分利用语音识别与手动操作各自的优势。只要能很好地规避语音交互的一些障碍,加之语言与听觉交互在现代电子计算机的发展过程中占据着越来越重要的地位,是使用户工作与生活便捷化的一个重要方式,并且使用正确地方法攻克识别的难关且在适当的领域中充分发挥其特点充分考虑用户需求进而发展。那么就可以使得语音与听觉交互有着更好地发展。参考文献:方志刚,胡国兴,吴晓波.基于非语言声音的听觉用户界面研究[J].浙江大学学报.喻耀华,刘正捷.听觉显示研究与应用[J].计算机科学, 2008,3506:272-275.黄学东.无处不在的语音用户界面VOICE UI[EB/OL]. /blog/static/座机电话号码00座机电话号码39173/,2009.their own conditions to develop the correct road, the maximum to avoid investment risk, gain profit.three vigorously promote the brand. To establish brand awareness, awareness of the use of brand, brand value, brand acquisition pe
文档评论(0)