机器视觉应用技术语音识别(百度云边应用).docxVIP

机器视觉应用技术语音识别(百度云边应用).docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

语音识别

一、实验目的

1.掌握百度语音识别的方法。

2.掌握AiCam框架的部署和使用。

二、实验内容

1.算法原理

1.1基本描述

百度短语音识别标准版应用,将60秒以内的语音精准识别为文字,可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景。百度短语音识别包含中文普通话输入法、英语、粤语、四川话、远场5个识别模型。其中Android,iOS,LinuxSDK支持超过60秒的实时场语音识别。

2.功能设计

2.1功能描述

AiCam人工智能轻量化应用框架是一款面向于人工智能边缘应用的开发框架,采用统一模型调用、统一硬件接口、统一算法封装和统一应用模板的设计模式,实现了嵌入式边缘计算环境下进行快速的应用开发和项目实施。

AiCam为模型算法的调用提供RESTful调用接口,应用端接收语音指令传递给边缘计算平台进行语音识别,同时通过物联网云平台的应用接口,实现与硬件的连接和互动,最终形成各色智联网产业应用。

AiCam框架如下图所示:

三、实验步骤

1.工程部署

1.1硬件部署

1)准备人工智能边缘应用平台,给边缘计算网关正确连接Wi-Fi天线、麦克风(麦克风阵列或者Ai语音摄像头)、电源。

2)按下电源开关上电启动边缘计算网关,将启动ubuntu操作系统。

3)系统启动后,连接局域网内的Wi-Fi网络,记录边缘计算网关的IP地址,比如:00。

1.2工程部署

1)运行MobaXterm工具,通过SSH登录到边缘计算网关。

2)在SSH终端创建实验工作目录:

3)通过SSH将本实验工程代码和aicam工程包

4)在SSH终端输入命令解压缩实验工程

2.算法测试

1)修改算法文件algorithm\baidu_speech_recognition\baidu_speech_recognition.py内的单元测试代码,填写正确的百度账号信息。

2)文件修改好后,通过MobaXterm工具创建的SSH连接,将修改好的文件上传到边缘计算网关

3)在SSH终端输入以下命令运行算法进行单元测试,本实验将会读取测试音频文件,在终端打印识别的结果

3.工程运行

1)修改工程配置文件static\baidu_speech_recognition\js\config.js内的百度账号信息,填写正确的百度账号信息。

2)文件修改好后,通过MobaXterm工具创建的SSH连接,将修改好的文件上传到边缘计算网关

3)在SSH终端输入命令运行实验工程:

4.语音识别

1)点击实验交互区右下角的录音图标,进行录音,此时录音图标显示动态效果,提示“录音中”,再次点击录音图标则完成录音,算法将进行语音识别并弹窗提示识别状态。

由于采用的是https安全链接,chrome浏览器会提示安全信息,点击左下角的高级按钮,在下面点击“继续前往XXX(不安全)”进入到应用页面。

点击录音后,chrome浏览器会弹出提示使用麦克风的权限,需要点击“允许”继续。

2)在实验交互区和实验结果区都可以看到识别的语音文字结果。

文档评论(0)

中智讯 + 关注
官方认证
服务提供商

中智讯(武汉)科技有限公司,是一家服务于高校信息类新工科教育解决方案的高新技术企业,公司自创立以来一直致力于工科教育解决方案及高校科研协作,始终坚持以“易教,易学,易研,易用”为企业产品定位,以“踏实做事,诚信做人”的经营理念为立业之本,并形成了一套完整的从教学设备、教学教材、师资培训、专家授课、科研合作的综合性教育解决方案体系。

认证主体中智讯(武汉)科技有限公司
IP属地湖北
统一社会信用代码/组织机构代码
914201110591757379

1亿VIP精品文档

相关文档