《人工智能基础与应用》教案 项目五 人工智能应用:能说会唱(上).docVIP

  • 5
  • 0
  • 约3.03千字
  • 约 5页
  • 2025-04-28 发布于江苏
  • 举报

《人工智能基础与应用》教案 项目五 人工智能应用:能说会唱(上).doc

PAGE4

PAGE4

PAGE5

PAGE5

课题

项目五人工智能应用:能说会唱(上)

课时

2课时(90min)

教学目标

知识技能目标:

了解语音合成技术及其应用。

了解语音克隆和音色转换技术及其应用。

了解人工智能音乐创作技术及其应用。

能够使用人工智能工具生成音频。

能够使用人工智能工具的音频生成功能解决实际问题。

思政育人目标:

通过了解语音克隆可能引发的安全隐患,增强相关法律素养,提高安全防范意识。

通过认识世界顶尖的国产音乐模型,增强民族自豪感。

教学重难点

教学重点:人工智能音乐创作。

教学难点:语音合成的主要流程、语音克隆的主要流程。

教学方法

问答法、讨论法、讲授法、演示法

教学用具

电脑、投影仪、多媒体课件、教材

教学过程

主要教学内容及步骤

课前任务

【教师】布置课前任务,和学生负责人取得联系,将学生分组并分工,完成课前任务

请各组组长组织组员查找相关资料或扫码观看微课视频,讨论并回答下列问题:

问题1:什么是音频生成?

问题2:请列举3个音频生成的应用场景。

问题3:请列举3个人工智能音乐创作工具。

【学生】完成课前任务

考勤

【教师】清点上课人数,记录好考勤

【学生】班干部报请假人员及原因

教学过程

任务一生成音频

问题导入

【教师】提出以下问题:

请大家讨论一下,音频生成有哪些应用场景?

【学生】思考、举手回答

【教师】通过学生的回答引入要讲的知识

传授新知

一、人工智能语音生成

【教师】通过多媒体讲解人工智能语音生成

1.语音合成

语音合成是指通过机械的、电子的方法产生人造语音的技术。它将基本语音信息数字化,然后利用计算机系统仿真出人类的声音。多数情况下,人们提到的语音合成是指文语转换(texttospeech,TTS),即将文本信息转换为对应的语音信号的技术。

?【提示】在没有特殊说明的情况下,本项目探讨的语音合成是指文语转换。

语音合成已广泛应用于影视娱乐、新闻媒体、医疗健康、电子商务、智能家居、自动驾驶等多个领域,具体应用涵盖了有声书朗读、新闻自动播报、医院叫号系统、智能语音客服、语音助手服务、车载语音导航等。

语音合成的主要流程包括文本预处理、声学模型训练和语音生成3个阶段。

?【教师】引导同学扫码观看视频

?【学生】观看——语音合成的主要流程

?【教师】讲解语音合成的主要流程

在开放平台方面,众多知名企业,如科大讯飞、百度、阿里云、腾讯、字节跳动等,纷纷依托自身强大的技术实力,推出了集成先进语音技术的在线开放平台,如讯飞开放平台、百度AI开放平台等。

?【提示】用户在体验在线开放平台的某些功能时,可能需要进行实名认证,完成认证后才能正常体验相关功能。在线开放平台主要提供付费服务,用户按需付费后,可根据官方指定的API接口、SDK或直接在平台上操作来使用购买的服务。

市面上还涌现了众多专注于语音合成的便捷工具,它们操作简单、直观,方便用户日常使用,如TTSMaker、REECHO等。

?【教师】举例:以百度AI开放平台的语音合成功能为例,展示语音合成的实际应用。

2.语音克隆

语音克隆是利用人工智能技术对某个特定人物的声音进行复刻,并以此合成指定语音内容的技术。

例如,在智慧语音助手、智能家居、自动驾驶等领域,用户可以根据个人喜好,为智能设备设定特定人物的语音,从而增强用户的个性化体验;在教育培训领域,语音克隆技术可用于模仿老师或家长的语音,为学生量身定制语音课程,能够有效增强学习的沉浸感和互动性;在影视娱乐领域,语音克隆技术使得经典角色的声音在新作品中得以延续;等等。

?【素养之窗】语音克隆技术的挑战。

语音克隆的主要流程可以分为特征提取、模型训练和语音生成3个阶段。

目前,用户可以通过购买在线开放平台的相关服务实现语音克隆(如火山引擎、腾讯云、讯飞智作等提供的相关语音技术服务),或者使用语音克隆应用工具(如REECHO、GPT-SoVITS等)复刻并应用语音。

?【教师】举例:以火山引擎的豆包声音复刻大模型为例,展示语音克隆的实际应用。

3.音色转换

音色转换是一种声音处理技术,与传统变声技术依赖调音器改变音色不同,它通过深度学习算法、声音特征提取等多项人工智能技术,力求在保留原始音频的内容、语气、节奏、情感等特征的基础上,实现音色的变化。

音色转换常用于各类直播场合,如游戏直播、电商直播、自媒体直播等,为直播增添了更多趣味性。除此之外,在短视频制作中,人们经常使用音色转换掩饰自己的原音,从而达到保护个人隐私的目的。

音色转换可以利用腾讯云等在线开放平台提供的相关服务,或者大饼AI变声、FakeYou等专用工具来实现。除此之外,许多应用软件(如QQ、快影等)也集成了音色转换功能,方便用户在聊天、视频制作、直播等场景中使用。

?【教师】举例:以腾讯云的音

文档评论(0)

1亿VIP精品文档

相关文档