- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
信息技术课件语音识别的秘密
计算机识别声音的流程声音采集声学特征提取声学模型训练声学模型应用图1:声音识别的基本流程训练识别
计算机识别声音的流程声音采集声音采集训练识别特征提取模型训练特征提取特征比对声学模型识别声音
计算机识别声音的流程声音采集声学特征提取声学模型训练声学模型应用图1:声音识别的基本流程
声音的采集计算机感知声音主要通过话筒中的传感器将声波转换为电信号01采样02量化03编码声音的数字化
语音的特征又叫声学特征。声音主要有三个要素:响度、音调和音色。频谱(frequency)可以直观地反应声音的三个要素信息,因此计算机理解声音主要通过频谱。声学特征提取什么是声学特征频谱幅度频率
优点:1.维数更低,可以粗略刻画出频谱的形状2.表的出声音的另一个重要特征——共振峰声学特征提取梅尔频率倒谱系数(MFCC)
常见的声学特征包括:基频、能量、时长、共振峰、梅尔频谱倒谱系数(MFCC)、广义梅尔频谱倒谱系数等。声学特征提取韵律特征频谱特征常见的声学特征
声学模型训练训练语料库提取一句训练语料特征提取模型训练中间模型m1m2m3m…模型训练结束模型库特征提取文本语音语音特征文本特征图2:语音识别中模型训练的过程
声学模型应用图3:利用模型识别语音的具体过程语音采集特征提取模型匹配输入待识别的语音输出结果模型库
声音识别实例语音输入法输入语音语音特征提取模型匹配输出文字图5:语音输入法的工作流程语音识别声学模型
第一,设计一个特征提取器从音乐中提取特征第二,利用特征训练一个分类器第三,利用分类器根据音乐特征判断其风格类型梅尔频率倒谱系数神经网络声音识别实例音乐风格识别音乐特征提取器特征分类器风格类型音乐提取特征、特征比对
第一,设计一个特征提取器从音乐中提取特征第二,利用特征训练一个分类器第三,利用分类器根据音乐特征判断其风格类型声音识别实例音乐风格识别输入音乐特征提取模型匹配风格类型音乐风格声学模型
感谢聆听
文档评论(0)