- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
学而优教有方
PAGE2/NUMPAGES2
第5节体验语音合成与人脸识别技术
【学习目标】
1、了解语音合成技术及人脸识别技术。
2、理解语音合成技术的主要过程及学会模拟自己的声音;
3、理解常用的人脸识别技术及利用人工智能服务平台体验人脸识别技术。
【教学重点】
1、理解语音合成技术的主要过程及学会模拟自己的声音
2、理解常用的人脸识别技术及利用人工智能服务平台体验人脸识别技术。
【教学难点】
1、理解语音合成技术的主要过程及学会模拟自己的声音
2、理解常用的人脸识别技术及利用人工智能服务平台体验人脸识别技术。
【教学过程】
导入新课
随着人工智能的发展,越来越多的应用进入到我们的生活中。自然语言处理是人工智能应用的重要领域。人工智能应用服务的终端不仅能够识别我们的话语,还能够利用机器合成各种语音,与我们进行交流,提供服务与帮助。除了可以像人类一样拥有听觉和言语的能力,它们还拥有“视觉”能力,能够“看懂”客观世界的事物,认识周围的人、事、物。例如,我们可以通过智能平台,把文字输入,就可以用语音的形式读出来;新闻里说,现在可以刷脸吃饭,用的也是人工智能技术今天我们就来了解这方面的知识。
讲授新课
活动任务
本节我们就来体验一下智能应用是如何与人“沟通”和“看”世界的。
教师提出问题
(1)人工智能是如何“听懂”人类语言的?
(2)人工智能是如何“认识”人类的?
活动建议
随着技术的发展,语音合成的技术无处不在。
朗读听声软件将文本转化成语音“读”给你听、智能助理通过语音和我们交流、客服机器人可以随时接听电话回答用户的问题、导航软件根据语音包以各种人的语气实时播报前方线路。在这些“交流”中,智能应用发出声音回应我们的行为采用的就是语音合成技术。
建议安装如“讯飞有声”等软件,来体验这种“交流”。
我们也许接触过公共场所的人脸识别系统,或者使用过网络平台的识图功能,以及利用手机的美颜拍摄软件对图片进行优化处理。建议选择一款美颜拍摄软件或者智能识图的网络平台来探究一下识图技术。
活动过程
体验并探究语音合成技术
语音合成和语音识别技术是实现人机语音通信,建立一个有听和讲能力的口语系统所必需的两项关键技术。
语音合成,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是中文信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人一样开口说话。
1.体验文本转换为语音的技术
以“讯飞有声”应用程序为例,请同学们下载并安装该软件,在文本框中输入需要播放的文字内容.
文字内容可以直接录入,也可以从网站或者文档中复制并粘贴进来。
选择不同主播的声音进行播放。
想一想
思考并回答以下问题
(1)更换主播后,声音播放的具体内容是否发生了变化?
(2)更换主播操作究竟改变了什么?
(3)从文字的录入到语音播出,你认为经历了哪些过程?
2.了解语音合成技术的主要过程
将文字信息转换为流利的可听懂的口语输出技术,称为语音合成。
这是一项综合技术,不仅需要计算机理解信息含义,保证信息正常输出,还需要利用声学相关知识,使内容可以转换成恰当的声学模型进行语音输出。
(1)理解文本信息的含义
在语言学家和计算机科学家的共同努力下,将文本中的语法规则转化成相应的程序输入计算机中,系统根据相应算法,为文本进行断句,准确获取文本需要表达的内容,这是文本分析的过程。
(2)韵律处理
在理解文本的内容后,通常需要考虑在读取这段文本时使用的节奏、时长、频率等,从而使计算机的发音更接近于人类说话的声音。
(3)创建声学模型模拟发音
这个过程类似我们模仿他人声音,需要考虑语种、音色、响度、音调等。
计算机模拟的方法是在原始的语音库中提取相关的声音信息,采用单元合成与拼接技术将信息进行拼接,从而达到模拟发声的效果。
语音合成的基本过程
3.模拟自己的声音
(1)明确任务
利用“讯飞留声”复刻自己的声音,然后让机器模仿自己的声音,进行一段双语朗诵。
(2)解决问题要点分析
计算机完成对人类声音的模仿,有以下两个关键内容:
第一,形成个人的声音库,为计算机提供声学模型。
通过形成个人的音库,将具有个人特色的声学信息(音色、音调、响度等)存储在其中,使计算机能够提取出相关数据。
第二,通过和个人音库匹配,完成合成。
通过语音合成技术,在识别文本内容的前提下,通过与个人音库中的信息相匹配,从而使计算机可以模仿我们的声音进行输出。
(3)模拟声音的步骤
第一步,关注微信公众号“讯飞留声”,选择“复刻声音”,进入程序。单击“去复刻我的声音”按钮,开始进入工作状态。
第二步,根据要求,朗读10段文字,按“话筒键”开始,“停止键”结束。
注意录制时声音要清晰
您可能关注的文档
- 4节 动画原理探究》参考教案.docx
- 《第3节 微视频编辑与制作》参考教案.docx
- 《第2节 素材处理和脚本规划》精品课件.pptx
- 《第2节 素材处理和脚本规划》参考教案.docx
- 《第1节 调查研究与观点整理》参考教案.docx
- 《第1节 调查研究与观点整理》精品课件.pptx
- 《第15节 图书借阅“琅琊榜”(一)》精品教案.docx
- 《第14节 营养午餐研究(三)》参考课件.pptx
- 《第14节 营养午餐研究(三)》精品教案.docx
- 《第13节 营养午餐研究(二)》精品教案.docx
- 2025-2026部编人教版小学6六年级语文下册(全册)优秀试卷【含答案】.doc
- 湖南省长沙市第一中学2024-2025学年高三上学期阶段性检测(五)化学试题 Word版含解析.docx
- 2024-2025学年中职英语第一册人教版(中职三年制)教学设计合集.docx
- 市政道路(桥梁)专业中级职称理论考试题及答案.pdf
- “泰山杯”山东省网络安全职业技能竞赛理论试题及答案.pdf
- 广西气象行业职业技能竞赛(综合业务理论)试题及答案.pdf
- 第五届“高新匠领”职业技能大赛(幼儿发展引导赛项)理论试题及答案.pdf
- 全国测井工技能竞赛决赛试题及答案.pdf
- 2023年课后服务经费的管理制度 .pdf
- 2024年DDN线路密码机项目运营管理方案 .pdf
文档评论(0)