- 2
- 0
- 约4.15千字
- 约 5页
- 2020-12-26 发布于四川
- 举报
精品文档,助力人生,欢迎关注小编!
车载移动场景下语音识别系统设计
打开文本图片集
摘 要:在汽车驾驶中,由于各种意外情况,驾驶者经常需要去控制手机或者车内的其它设备,这时手就会离开方向盘,这显然给汽车安全驾驶埋下安全隐患。因此,利用智能语音识别技术来改变驾驶环境下现有的人机交互方式,从而解放驾驶者的双手,有效的提高驾车安全性。本设计以Android开发平台为基础,为车载环境下的用户提供一个可以直接识别语音指令的系统。该系统主要实现语音识别、语音合成、查看当前位置、导航、控制车辆天窗等功能。结果表明,该系统具有较好的识别效果,界面友好操作简便,能够消除一定的驾驶环境下的安全隐患。该平台也可以作为语音云体验质量测试的基础平台。
关键词:Android Studio;百度语音SDK;语音识别;语音合成
1设计背景与意义
服务机器人以服务为目的,但是在处理一些特定场景下的人机交互的时候,比如驾车时,这时候交互就会比较困难,因为没法空出双手没法去操控机器。因此人们需要一种更方便、更自然、更加人性化的方式與机器交互,而不仅仅是复杂的键盘和按钮操作。基于听觉的人机交互是该领域的一个重要发展方向。语音识别技术,也被称为自动语音识别,即让机器通过识别把人类的语音信号转变为相应的文本或命令的技术,能让计算机理解和运用人类的自然语言,实现人机之间的自然语音通信。自动语音识别技术所要解决的问题是就是让计算机能够“听懂”人类的语言,将语言中包含的文字信息“提取”出来。
语音识别技术是一门交叉学科 ,语音识别正逐步成为信息技术中人机交互的关键技术,语音识别技术与语音合成技术的结合,开启了人机交互方式的新时代,它将彻底解放用户的双手与眼睛,使人们能够甩掉键盘,通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。当今,语音识别产品在人机交互应用中占到越来越大的比例。不难想象,语音命令操作一定会完美替代现如今智能设备上最为流行的按键以及触摸操作。
如今汽车工业在不断发展,人们的生活品质随着可以驾车出行有着巨大的提升,同样的,智能车载系统也是人们最为看重的。随着车载语音系统及各类语音识别软件的开发,语音识别开始走入人们的生活,凭借其实用性和准确性得到了用户的认可。互联网和移动通讯技术的不断发展加快了移动APP的广泛应用,这意味着语音识别技术逐渐走进了移动APP中。本系统摒弃了传统的、繁杂的手动操作的累赘。系统旨在改变传统的人机交互方式,使人们能够在生活环境中采用更为直接便利的方式与手机对话,获取更为便捷有效的人机交互。
2系统的总体设计
系统的总体功能模块结构如图1所示,其中,语音识别模块和语音合成模块的实现利用的是百度语音技术服务提供的软件开发工具包。GPS定位模块和APP拉起模块利用的是安卓自带的软件开发工具包来实现的。
本次设计所采用的百度语音识别技术是通过百度语音开放平台为广大开发者提供精准、免费、安全、稳定的服务。不同于以往的识别模块,百度的语音识别技术采用的是类似神经网络的深度学习算法,这个算法是比目前主流语音识别系统更为简单更为有效的方法,所以也大幅度的提升了识别效率。
上传整个录音文件。百度语音识别要求安静的环境,真人的正常语速的日常用语,并且不能多个人同时发音。
以下场景讲会导致识别效果变差:
1)吵杂的环境;
2)有背景音乐,包括扬声器在播放百度合成的语音;
3)使用非远场语音时,离麦克风较远。
语音识别SDK的主要输入事件如表1所示
其中,主要利用ASR_START 事件常用的输入事件参数如表2所示。
3 系统的功能设计与实现
3.1软件的总体设计
软件主要包括五个功能,分别为语音识别功能、语音合成功能、位置获取功能、音乐播放功能以及交互功能。语音识别功能实现将外界的语音信息识别转换为机器可以理解的字符序列。语音合成功能实现的是将语音识别的字符序列合成为语音并播放。位置获取功能是通过手机GPS获取当前的位置信息并保存。音乐播放功能是启动新界面并自动开始播放音乐。交互功能通过语音识别的结果,判断外界语音的目的。例如外界语音内容为“打开虾米音乐”,语音识别模块将进行识别,并显示识别结果“打开虾米音乐”,语音合成模块将会合成内容“正在打开虾米音乐”并且播放,同时交互模块会启动手机里面的虾米音乐APP,系统的总体流程图如图1所示。
3.2 语音识别功能实现
语音识别的实现首先新建事件监听类对象EventListener yls,并实现回调接口OnEvent(String name, String params, byte[] data, int o
原创力文档

文档评论(0)