人工智能素养与技术应用 课件 任务一 处理音频.pptx

人工智能素养与技术应用 课件 任务一 处理音频.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

任务一音频处理

创设情境王华最近接了一个项目,要将一部分文字内容转为语音,然后把部分语音材料整理成文字,他提出一个充分利用人工智能技术的方案,利用文字转语音服务平台轻松解决这个问题,借助生成式人工智能整理语音材料成文字稿、文字材料生成语音资料,并且还可以提供多语言配音,创造交互式体验。

活动目标1.了解目前文字生成音频和音频转文字的主流平台。2.掌握文字生成音频和音频转文字的一般操作步骤。3.音频处理给我们的学习、生活和工作带来的便利。

活动准备初步了解文字生成音频和音频转文字时的常识和工具:1.了解TTS的原理:TTS是TextToSpeech的缩写,即“从文本到语音”,是人机对话的一部分,让机器能够说话。TTS是语音合成应用的一种,它将储存于电脑中的文件,如帮助文件或者网页,转换成自然语音输出。主要功能包括文本分析、语音合成、韵律处理。

活动准备初步了解文字生成音频和音频转文字时的常识和工具:2.讯飞智作平台:讯飞智作是科大讯飞旗下的一款AIGC内容生产平台,它整合了多项核心技术成果,在语音处理、人工智能等领域发挥优势。例如在智能语音技术方面,涵盖了音频处理、语音识别、语音合成、语音评测等一系列核心产品和技术。从创作功能角度看,它就像是一个全能的创作助手,在实际应用场景中,讯飞智作也展现出了很强的适应性。

活动准备初步了解文字生成音频和音频转文字时的常识和工具:3.TTSMaker:它的核心功能就是将文本转换为语音,我们只需将需要配音的文本输入到工具中,选择相应的语言和声音,即可在短时间内生成高质量的语音。这大大节省了用户的时间和精力,让配音变得更加轻松、高效。

活动准备初步了解文字生成音频和音频转文字时的常识和工具:4.海绵音乐:它是一个利用人工智能技术的音乐创作平台,可以快速生成个性化的音乐作品。通过提供多样化的音乐风格模板和情感主题,简化音乐创作的复杂性,即使是没有专业音乐也能轻松创作出属于自己的音乐。

活动准备初步了解文字生成音频和音频转文字时的常识和工具:5.讯飞听见:一款由科大讯飞推出的智能语音转文字软件,它的功能能够大幅提升用户在会议记录、授课演讲、媒体采访等场景下的工作效率,如实时语音转写、多语种翻译、边录边拍、悬浮字幕、文本结果导出等功能。

活动准备初步了解文字生成音频和音频转文字时的常识和工具:5.剪映软件:我们将在学习拟声这一功能时用到剪映软件,它的“声音克隆”功能是一项创新技术,我们能快速复制自己的声音。通过录制5秒钟的语音,AI模型能够学习并生成与我们音色极为相似的语音内容。

活动展开-文本转换音频参照教材中“活动展开”,尝试操作。1.输入文本,“文本纠错”后试听效果。?扫描观看粘贴文字稿到文本框

活动展开-文本转换音频参照教材中“活动展开”,尝试操作。1.输入文本,“文本纠错”后试听效果。?扫描观看智能纠正错别字界面

活动展开-文本转换音频参照教材中“活动展开”,尝试操作。1.输入文本,“文本纠错”后试听效果。?扫描观看试听按钮多音字选择读音界面

活动展开-文本转换音频参照教材中“活动展开”,尝试操作。2.选择语言、语音包类型和语速?扫描观看“关山”角色语音主播选择界面

活动展开-文本转换音频参照教材中“活动展开”,尝试操作。3.停顿设置和添加背景音乐。?扫描观看配音停顿设置设置背景音乐

活动展开-文本转换音频参照教材中“活动展开”,尝试操作。4.生成音频文件。修改生成音频文件名称为“《桃花源记》语音生成”、设置生成音频文件格式为“mp3”。?扫描观看转换并下载配音文件

活动展开-音频转换文本参照教材中“活动展开”,尝试操作。1.讯飞听见模块“会记”功能。打开讯飞听见官网,选择“讯飞听见”模块,下拉选项中选择电脑自带麦克风。?扫描观看会记功能选择界面语音转文字参数设置

活动展开-音频转换文本参照教材中“活动展开”,尝试操作。2.手机收音电脑端依次点击“设置”、“微信收音”,移动端扫二维码,切换到手机录音界面,开始实时语音转换文字。?扫描观看提示:PC端和移动端使用同一个账号登录。切换到手机录音实时语音转换文字

活动展开-拟声参照教材中“活动展开”,尝试操作。1.导入音频文件打开剪映软件,导入音频文件,将音频文件拖动到音轨上。扫描观看素材拉进音轨导入语音文件

活动展开-拟声参照教材中“活动展开”,尝试操作。2.克隆系统内置声音进入音色广场,试听各种角色,满意后单击头像选中。扫描观看音色广场选择音色界面

活动展开-拟声参照教材中“活动展开”,尝试操作。3.导出克隆声音文件试听得到满意的效果后,依次点击“菜单”-“文件”-“导出”设置格式为mp3,导出音频文件。导出克隆音频文件导出文件设置框扫描观看

拓展提高-文本转换音频使用“多人配音”在讯飞智作平台中输入师生对话逐字稿,按住ctrl键的同时

您可能关注的文档

文档评论(0)

lai + 关注
实名认证
内容提供者

精品资料

版权声明书
用户编号:7040145050000060

1亿VIP精品文档

相关文档