- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
任务一音频处理
创设情境王华最近接了一个项目,要将一部分文字内容转为语音,然后把部分语音材料整理成文字,他提出一个充分利用人工智能技术的方案,利用文字转语音服务平台轻松解决这个问题,借助生成式人工智能整理语音材料成文字稿、文字材料生成语音资料,并且还可以提供多语言配音,创造交互式体验。
活动目标1.了解目前文字生成音频和音频转文字的主流平台。2.掌握文字生成音频和音频转文字的一般操作步骤。3.音频处理给我们的学习、生活和工作带来的便利。
活动准备初步了解文字生成音频和音频转文字时的常识和工具:1.了解TTS的原理:TTS是TextToSpeech的缩写,即“从文本到语音”,是人机对话的一部分,让机器能够说话。TTS是语音合成应用的一种,它将储存于电脑中的文件,如帮助文件或者网页,转换成自然语音输出。主要功能包括文本分析、语音合成、韵律处理。
活动准备初步了解文字生成音频和音频转文字时的常识和工具:2.讯飞智作平台:讯飞智作是科大讯飞旗下的一款AIGC内容生产平台,它整合了多项核心技术成果,在语音处理、人工智能等领域发挥优势。例如在智能语音技术方面,涵盖了音频处理、语音识别、语音合成、语音评测等一系列核心产品和技术。从创作功能角度看,它就像是一个全能的创作助手,在实际应用场景中,讯飞智作也展现出了很强的适应性。
活动准备初步了解文字生成音频和音频转文字时的常识和工具:3.TTSMaker:它的核心功能就是将文本转换为语音,我们只需将需要配音的文本输入到工具中,选择相应的语言和声音,即可在短时间内生成高质量的语音。这大大节省了用户的时间和精力,让配音变得更加轻松、高效。
活动准备初步了解文字生成音频和音频转文字时的常识和工具:4.海绵音乐:它是一个利用人工智能技术的音乐创作平台,可以快速生成个性化的音乐作品。通过提供多样化的音乐风格模板和情感主题,简化音乐创作的复杂性,即使是没有专业音乐也能轻松创作出属于自己的音乐。
活动准备初步了解文字生成音频和音频转文字时的常识和工具:5.讯飞听见:一款由科大讯飞推出的智能语音转文字软件,它的功能能够大幅提升用户在会议记录、授课演讲、媒体采访等场景下的工作效率,如实时语音转写、多语种翻译、边录边拍、悬浮字幕、文本结果导出等功能。
活动准备初步了解文字生成音频和音频转文字时的常识和工具:5.剪映软件:我们将在学习拟声这一功能时用到剪映软件,它的“声音克隆”功能是一项创新技术,我们能快速复制自己的声音。通过录制5秒钟的语音,AI模型能够学习并生成与我们音色极为相似的语音内容。
活动展开-文本转换音频参照教材中“活动展开”,尝试操作。1.输入文本,“文本纠错”后试听效果。?扫描观看粘贴文字稿到文本框
活动展开-文本转换音频参照教材中“活动展开”,尝试操作。1.输入文本,“文本纠错”后试听效果。?扫描观看智能纠正错别字界面
活动展开-文本转换音频参照教材中“活动展开”,尝试操作。1.输入文本,“文本纠错”后试听效果。?扫描观看试听按钮多音字选择读音界面
活动展开-文本转换音频参照教材中“活动展开”,尝试操作。2.选择语言、语音包类型和语速?扫描观看“关山”角色语音主播选择界面
活动展开-文本转换音频参照教材中“活动展开”,尝试操作。3.停顿设置和添加背景音乐。?扫描观看配音停顿设置设置背景音乐
活动展开-文本转换音频参照教材中“活动展开”,尝试操作。4.生成音频文件。修改生成音频文件名称为“《桃花源记》语音生成”、设置生成音频文件格式为“mp3”。?扫描观看转换并下载配音文件
活动展开-音频转换文本参照教材中“活动展开”,尝试操作。1.讯飞听见模块“会记”功能。打开讯飞听见官网,选择“讯飞听见”模块,下拉选项中选择电脑自带麦克风。?扫描观看会记功能选择界面语音转文字参数设置
活动展开-音频转换文本参照教材中“活动展开”,尝试操作。2.手机收音电脑端依次点击“设置”、“微信收音”,移动端扫二维码,切换到手机录音界面,开始实时语音转换文字。?扫描观看提示:PC端和移动端使用同一个账号登录。切换到手机录音实时语音转换文字
活动展开-拟声参照教材中“活动展开”,尝试操作。1.导入音频文件打开剪映软件,导入音频文件,将音频文件拖动到音轨上。扫描观看素材拉进音轨导入语音文件
活动展开-拟声参照教材中“活动展开”,尝试操作。2.克隆系统内置声音进入音色广场,试听各种角色,满意后单击头像选中。扫描观看音色广场选择音色界面
活动展开-拟声参照教材中“活动展开”,尝试操作。3.导出克隆声音文件试听得到满意的效果后,依次点击“菜单”-“文件”-“导出”设置格式为mp3,导出音频文件。导出克隆音频文件导出文件设置框扫描观看
拓展提高-文本转换音频使用“多人配音”在讯飞智作平台中输入师生对话逐字稿,按住ctrl键的同时
您可能关注的文档
- 人工智能素养与技术应用 课件 任务二 体验AIGC.pptx
- 人工智能素养与技术应用 课件 任务二 制作PPT课件.pptx
- 人工智能素养与技术应用 课件 任务二 智能翻译与图像识别.pptx
- 人工智能素养与技术应用 课件 任务二 生成视频.pptx
- 人工智能素养与技术应用 课件 任务二 智能处理 图像.pptx
- 人工智能素养与技术应用 课件 任务三 处理表格.pptx
- 人工智能素养与技术应用 课件 任务三 编辑视频.pptx
- 人工智能素养与技术应用 课件 任务三 智能设计图像.pptx
- 人工智能素养与技术应用 课件 任务四 智能阅读.pptx
- 人工智能素养与技术应用 课件 任务一 体验人工智能.pptx
- 人工智能素养与技术应用 课件 任务一智能对话.pptx
- 人工智能素养与技术应用 教案-教学设计 任务二 智能处理图像.docx
- 人工智能素养与技术应用 教案-教学设计 任务二 生成视频.docx
- 人工智能素养与技术应用 教案-教学设计 任务二 制作PPT.docx
- 人工智能素养与技术应用 教案-教学设计 任务二 智能翻译和图像识别.docx
- 人工智能素养与技术应用 教案-教学设计 任务二 走进AIGC.docx
- 人工智能素养与技术应用 教案-教学设计 任务三 智能设计图像.docx
- 人工智能素养与技术应用 教案-教学设计 任务三 编辑视频.docx
- 人工智能素养与技术应用 教案-教学设计 任务三 处理表格.docx
- 人工智能素养与技术应用 教案-教学设计 任务四 智能阅读.docx
最近下载
- 【新高考Ⅱ卷】2024年 普通高等学校招生全国统一考试真题语文试卷[带答案].pdf VIP
- 《中华人民共和国社区矫正法》培训与解读课件.pptx VIP
- 人工智能在消防与安全领域的应用培训.pptx VIP
- DB3301_T 0492-2025 老旧小区住宅加装电梯管理规程.docx
- 初中物理《电功率》主题单元设计.docx VIP
- Unit 3 Getting along with others 单元复习 课件-2024-2025学年高中英语牛津译林版(2020)必修第一册.pptx VIP
- 介绍我的家乡河南.pptx VIP
- WST406-2024临床血液检验常用项目分析质量标准.pptx VIP
- 2024年新苏教版一年级上册数学课件 第一单元 第4课时 认识0.pptx VIP
- 轮胎供应项目实施方案.pptx VIP
文档评论(0)