- 1、本文档共37页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
BasisofArtificialIntelligenceApplication人工智能应用基础模块三智能语音技术01
录音北京明天的天气怎么样?识别北京明天是晴天,最高气温28度,适合郊游。合成问答播放小红是公司的客服,每天要回复很多客户的电话,嗓子经常会变得沙哑。她一直盼望着:能不能把回复的文字转换成音频,自动播放给客户?
任务3:TTS文字转语音网络通信正常已安装Anaconda集成环境已安装百度SDK并注册用户1、任务描述准备一段文字(或文本文件)在百度平台创建语音应用并获取鉴权信息编写六段代码编译运行并收听结果2、环境要求3、任务设计本次任务是借助百度语音接口,将给定的文字转换成语音并播放出来。效果如下所示。}任务一请扫码完成集成环境百度平台我爱北京天安门,天安门上红旗飘!
1.熟悉语音处理的概念2.了解语音识别、语音合成、声纹识别、唤醒词等常用技术3.了解语音处理的常见应用4.能将文字转化为语音5.提升四个自信与工匠精神重点:1.语音处理的概念2.语音处理的相关技术与应用3.TTS文字转语音实践难点:1.语音处理的相关技术2.文字转语音实践知识?技能?素质重难点人工智能应用基础BasisofArtificialIntelligenceApplication
3.1语音处理的概念3.2语音处理的常用技术3.3语音处理的常见应用任务3:TTS文字转语音
语音处理(speechsignalprocessing)是研究语音发声过程、语音信号的统计特性、语音的自动识别、机器合成以及语音感知等各种处理技术的总称。它是一门研究如何让机器能够“听”和“说”的学科,属于人工智能中的感知智能范畴。语音处理概念图1、语音处理的定义3.1语音处理的概念
语音处理主要研究RNN,LSTM等基础算法,实现语音识别(包括语音唤醒)、语音合成、语音增强、声纹识别、语音评测等应用技术方向。目前,语音技术已经在智能家居、手机助理多个领域取得了良好的应用。语音处理技术与应用框架2、语音处理技术与应用框架3.1语音处理的概念MFCCGMM-HMM…DNN-HMMRNNLSTM基础算法语音识别语音合成语音增强……声纹识别应用技术手机汽车家居客服金融可穿戴智能机器人…业务场景
3.1语音处理的概念3.2语音处理的常用技术3.3语音处理的常见应用任务3:TTS文字转语音
语音识别:说的是什么?语音合成:替我说话!语音增强:消减噪音,让我听得清楚点声纹识别:是谁在说话?语音评测:你的发音水平如何?常用技术3.2语音处理的常用技术
语音识别,又称自动语音识别(AutomaticSpeechRecognition,ASR),是将人类的语音中的词汇内容转换为计算机可读的输入,它是利用计算机自动对语音信号的音素、音节或词进行识别的技术总称。1、语音识别3.2语音处理的常用技术语音识别一般流程科大讯飞棵大训非kēdàxùnfēi语言处理科大讯飞信号处理特征提取模型匹配声学模型声学库语言模型文本库
1、语音识别3.2语音处理的常用技术输入语音有效语言检测接口层特征提取语音识别语言模型声学模型识别结果语音前处理数据预处理语音训练集声学模型训练文本训练集数据清洗和正规化模型训练和优化语言模型训练系统流程HMMCNNDNNRNN
1、语音识别3.2语音处理的常用技术语音编码语音质量16K16bit、8K16bit、Speex压缩避免丢音、截幅、音量过小等理想音频丢音截幅音量过小输入语音:较高质量
1、语音识别3.2语音处理的常用技术声学一致性:待识别语音和语音训练集具有一致性数据预处理(NoiseRobust)语音训练集声学模型远场近场设备降噪用户口音声学匹配:声学一致性声学模型训练
1、语音识别3.2语音处理的常用技术文本一致性:待识别领域和文本训练集具有一致性语言模型语言模型训练数据清洗和正规化模型训练和优化文本训练集领域数据核心词汇wǒxǐhuānbǎidù我喜欢文本匹配:文本一致性百度摆渡!
1、语音识别3.2语音处理的常用技术语音识别语义理解对话管理语音唤醒声纹识别大白你好小明你好语音合成语音唤醒:在手机、玩具、家电等设备在休眠或锁屏状态下,能检测到用户发出的“小度小度”或“小爱同学”等唤醒词,让处于休眠状态下的设备直接进入到等待指令状态,开启语音交互第一步。
1、语音识别3.2语音处理的常用技术特征提取关键词识别声学模型库阈值?得分接受拒绝错误拒绝率(FRR)错误接受率(FAR)功耗语音唤醒:唤醒词设计简单易记日常少用易于唤醒3-4个音节
语音识别主要包括语音听写、语音转写等细分应用,以及语音唤醒这个特殊应用。1、语音识
您可能关注的文档
- 《区块链基础以及应用》 课件——3-4 激励层.pptx
- 《区块链基础以及应用》 课件——3-5 合约层.pptx
- 《区块链基础以及应用》 课件——3-6 应用层.pptx
- 《热缩片设计与制作》课件——任务四 牡丹花胸针.pptx
- 《热缩片设计与制作》课件——任务五 “围炉煮茶”团扇摆件.pptx
- 《人工智能应用基础》 课件——模块八 深度学习概述.pptx
- 《人工智能应用基础》 课件——模块二 计算机视觉技术.pptx
- 《人工智能应用基础》 课件——模块九 人工智能法律与伦理.pptx
- 《人工智能应用基础》 课件——模块六 AI应用与创新实践.pptx
- 《人工智能应用基础》 课件——模块七 机器学习概述.pptx
- GB/T 42125.2-2024测量、控制和实验室用电气设备的安全要求 第2部分:材料加热用实验室设备的特殊要求.pdf
- GB/T 42125.18-2024测量、控制和实验室用电气设备的安全要求 第18部分:控制设备的特殊要求.pdf
- GB/T 15972.40-2024光纤试验方法规范 第40部分:传输特性的测量方法和试验程序 衰减.pdf
- 中国国家标准 GB/T 15972.40-2024光纤试验方法规范 第40部分:传输特性的测量方法和试验程序 衰减.pdf
- 《GB/T 15972.40-2024光纤试验方法规范 第40部分:传输特性的测量方法和试验程序 衰减》.pdf
- GB/T 17626.36-2024电磁兼容 试验和测量技术 第36部分:设备和系统的有意电磁干扰抗扰度试验方法.pdf
- 中国国家标准 GB/T 17626.36-2024电磁兼容 试验和测量技术 第36部分:设备和系统的有意电磁干扰抗扰度试验方法.pdf
- 《GB/T 17626.36-2024电磁兼容 试验和测量技术 第36部分:设备和系统的有意电磁干扰抗扰度试验方法》.pdf
- GB/T 18851.1-2024无损检测 渗透检测 第1部分:总则.pdf
- 《GB/T 18851.1-2024无损检测 渗透检测 第1部分:总则》.pdf
最近下载
- 人教版数学6年级下册全册课件(2024年春季版).pptx
- 部门职责模版.doc VIP
- 明尼苏达员工满意度调查问卷(长式00题).docx VIP
- 销售部部门职责.docx VIP
- 前列腺盆腔综合征中国专家共识(2024版)解读(1)(1)PPT课件.pptx VIP
- TBT 3065-2020 弹条II型扣件规范.docx
- 2023年河南财政金融学院软件工程专业《计算机组成原理》科目期末试卷B(有答案).docx VIP
- 策划部门职责.docx VIP
- 基于模型的系统工程(MBSE)及MWORKS实践 课件 1 MBSE教材讲义 第一章 引论.pptx
- 《中华民族共同体概论》考试复习题库(含答案).docx VIP
文档评论(0)