智能语音技术及应用开发课件实践项目汇总：声音采集与分析 ---语音标注.pptx

下载文档

2
0
约2.74千字
约 54页
2025-03-02 发布于山东
举报
版权申诉
保障服务

智能语音技术及应用开发课件实践项目汇总：声音采集与分析 ---语音标注.pptx

1、本文档共54页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

智能语音处理技术实践项目声音采集与分析

采集声音分析声音体验混音

步骤一：下载“录音专家”APP步骤二：打开软件，使用软件采集声音，观察产生的音频频谱，并保存声音

步骤三：使用软件中的音频降噪功能，观察降噪处理前后音频频谱的变化。问题：一般具有什么特征的频谱会被判断为噪声呢？

步骤四：体验软件中的人声分离功能

步骤五：体验添加背景音功能

步骤六：体验变声录音功能

作业：请在职教云上传作业截图并完成完成任务评价。

智能语音处理技术实践项目搭建智能语音处理实践环境

Anaconda的下载与安装TensorFlow2.1安装语音识别实践环境测试

下载地址：/anaconda/archive/Anaconda3-5.2.0-windows-x86_64.exe

课后作业01下载数据集speechcommands语音识别数据集：https://dax-cdn.cdn.appdomain.cloud/dax-tensorflow-speech-commands/1.0.1/tensorflow-speech-commands.tar.gz

智能语音处理技术实践项目语音数字化项目实践

环境安装声音采集声音加工

任务描述：应用现有的声音录制和加工软件对语音信号的数字化过程进行形象化的了解。在声音加工的一般过程中“选择加工工具”一环节，主题任务——先分组录一首诗歌，选用一种声音加工工具如GoldWave，完成声音片断的截取和文件格式的转换。

步骤一：安装录音软件windows录音机程序或其它录音软件；GoldWave(中文版)，需配置适当数量的耳麦。

步骤二：使用windows录音机程序或其它录音软件，或GoldWave软件进行声音的采集并保存。

步骤三：“学生对自己刚录取的声音进行加工”------调整语速、截取无用的信息、增加效果和声音文件格式的转换。

步骤四：学生进一步运用GoldWave软件的效果功能对自己的作品进行优化。

作业：请在职教云上传作业截图并完成完成任务评价。

智能语音处理技术实践项目基于Praat的语音标注

环境安装读取音频文件软件操作

任务描述：首先下载Praat软件，熟悉软件界面；然后，在Praat中录音或读取音频文件；接下来，利用软件工具进行语音分析，显示三维语谱图、频谱切片、音高曲线、共振峰曲线、音强曲线等，并将相应的对象数据保存为磁盘文件；最后，利用软件实现语音标注，并保存标注文件。

步骤一：安装Praat

步骤二：Praat---Open---Readfromfile...---找到对应的声音或者Textrid文件，打开即可。注意：如果录音较长,选择Extractpart,输入起始时间(单位为秒),点击OK即可。

步骤三：语图分析在PraatObject列表中选中要进行分析的录音片段,单击右侧的Analysespectrum下的Tospectrogram…，按OK按钮提交程序后,会得到一个类型Spectrogram的声音文件，单击右侧的View即可观察到语图，如图所示。语谱图是一种三维图形，横坐标和纵坐标分别表示语音持续的时间和对应的频率，而第三维坐标一般为灰度图或者是彩色图，代表对应时刻语音的强度。在语图分析中,如果要重点分析不同时间下的频率可以选择宽带语图,如果时间区域不明显可以选择分析窄带语图，前者常用来分析音色，后者常分析谐波和音高。

步骤三：语图分析在PraatPicture窗口中选定画图的区域，单击右侧的Draw下的Paint...,在弹出的对话框中填入所要分析的录音片段的起始时间就得到了宽带语图,其中,横坐标表示时间,纵坐标表示频率,能量的强弱用颜色的浓淡来表示,如图所示。还可以单击Margins菜单下的marksleftevery和marksbottomevery可以为语图添加横纵坐标。

步骤三：语图分析如果要得到特定时间点的频率和能量,我们可以做二维频谱分析,下面我们针对上面做出的宽带语图来做其片段分析。首先,在PraatObject列表中选中类型为Spectrogram的对象,单击右侧Analyse下的ToSpectrum(slice),在弹出的文本框中输入某一时间点会得到一个类型为Spectrum的声音文件，如图所示。

步骤四：语音标注创建一个空白的标注文件。同时选中语音文件和TextGrid文件，点击ViewEdit，就可以进行标注了。

步骤四：语音标注标注时，根据听辨边界，以及查看语图的信息，确定音素或者音节的边界。使用菜单上的showpitch可以显示基频线，用showformant可以显示共振峰线，用showintensity可以显示音强线。

步骤四：语音标注GLOBAL层主要标注语音文件的一些全局信息，包括说话人性别信

您可能关注的文档

文档评论（0）

lai + 关注: 实名认证

内容提供者

精品资料

咨询Ta 进入空间

用户编号：7040145050000060

1亿VIP精品文档

更多 >

智能语音技术及应用开发课件实践项目汇总：声音采集与分析 ---语音标注.pptx