《人工智能导论》——实训手册-语音处理.docxVIP

  • 0
  • 0
  • 约3.35千字
  • 约 13页
  • 2026-02-11 发布于福建
  • 举报

《人工智能导论》——实训手册-语音处理.docx

人工智能导论

模块3应用-语音处理实训手册

《人工智能导论》课程组

目录

TOC\o1-3\h\z\u11900839141实践目的 1

2实践环境 2

16155993513实践要求 2

5950595894实践步骤 2

3351682444.1资源环境准备 2

3230708274.2APIExplorer 3

10127297734.3语音识别 4

21413923364.4语音合成 10

7025510795实践总结 11

9108935476讨论与作业 11

1实践目的

介绍如何使用华为云语音交互服务功能

了解长录音文件如何放在OBS(对象存储服务)或公网可访问的服务器上

掌握如何使用录音文件接口来识别长录音文件,获取录音文件识别结果及识别状态

了解在APIExplorer中调试华为云语音互助服务接口,如何进行自动认证鉴权

如何使用APIExplorer自动生成SDK代码示例,在本地调用对应功能功能。

了解语音合成的使用方法及如何进行语音合成

2实践环境

(1)华为云EI企业智能语音交互服务

(2)对象存储服务OBS

3实践要求

本实践要求在华为云EI企业智能,使用语音交互服务,具体包括:

华为云上进行语音识别

本地语音识别

云上进行语音合成

本地语音合成

4实践步骤

4.1资源环境准备

登录华为云(学习者可自行注册登录。/)

然后注意:我们在“华北-北京四”的区域完成本实践。区域选择的步骤如下:先登录控制台,左上角会有区域的选择,选择“华北-北京四”。

4.2APIExplorer

在北京四区域,点击搜索,输入“APIExplorer”,进入“APIExplorer”界面。

在“APIExplorer”界面,区域选择:“华北-北京四”,然后依次选择“所有产品”-“人工智能”-“语音交互服务”,进入语音交互服务界面,如下图所示。

4.3语音识别

获取语音文件的访问路径

①搜索华为云“对象存储服务OBS”,并进入。

②进入本课程的OBS桶:ai-intro-wzvtc

③找到本次课的资源文件夹:speech-processing

④进入/speech-processing/chinese目录,找到16k.pcm文件,点击“分享”按钮。

⑤复制该文件的链接,建议先粘贴到一个记事本中。

选择“语音交互服务”-“语音识别接口”-“PushTranscriberJobs”-填入“Region”为“华北-北京四”,填projectID为“华北-北京四”下的项目ID

选择“audio_format”的值为pcm16k16bit,选择“_property”的值为chinese_16k_conversation

输入桶的地址data_url,即前面复制好的16k.pcm的分享链接

(5)点击“调试”,显示“调试成功”,在响应结果的响应体中找到job_id

?job_id:?f0e3f530fb864aa5b0a3a94472dad779

这个job_id务必先记下来(比如先复制粘贴到记事本中)

(6)选择“语音识别接口”-“CollectTranscriberJob”,填入project_id和job_id

?job_id:?f0e3f530fb864aa5b0a3a94472dad779

(7)点击“调试”-显示“调试成功”,可以看到请求体和响应体内容;

(8)查看响应结果的内容

{

?status:?FINISHED,

?create_time:?2022-08-12T01:31:31.045Z,

?start_time:?2022-08-12T01:31:31.270Z,

?finish_time:?2022-08-12T01:31:32.131Z,

?audio_duration:?7000,

?segments:?[

??{

???start_time:?80,

???end_time:?7025,

???result:?{

????text:?华为致力于把数字世界带入每个人每个家庭每个组织构建万物互联的智能世界

???}

??}

?]

}

课后实训任务:

录制一段音频

打开“对象存储服务OBS”在softwaredev-2202桶中的以自己学号命名的目录下上传录制的音频;

按前面步骤进行操作,验证一下调用结果是否最终结果是否可以识别。值得注意的是,在调用PushTranscriberJobs时,参数“audio_format”的值可以设为auto,避免音频文件的格式问题。

在作业中上传音频文件与最终调用结果截图,并说明是否成功,若不成功,也请说明原因。

4.

文档评论(0)

1亿VIP精品文档

相关文档