单片机的C语言应用设计解释.ppt

* * 科大推崇ARM9系列,因为支持Windows CE,具有可移植性,而且性价比较好。(ARM 和 DSP 开发板的价格相当,相差一两百元) 我们重要的是把模型训练做到硬件中,需要较多的硬件资源 * 无需用户进行录音训练,但是必须基于一个好的语料库,包含所有的词,然后以音素作为识别单元,利用词汇表、语法网络,实现连续语音识别。 不再是孤立词的识别,匹配的难度增加,但这里必须这么做。前面提到的非特定人语音识别也是这么做。 连续语音识别,所以不再用关键词识别; 语料库,所以不是开始一段时间的搜集,但可以考虑语音分类,如男女声 可以考虑给出 N-best 的结果,再二次识别 * 无需用户进行录音训练,但是必须基于一个好的语料库,包含所有的词,然后以音素作为识别单元,利用词汇表、语法网络,实现连续语音识别。 不再是孤立词的识别,匹配的难度增加,但这里必须这么做。前面提到的非特定人语音识别也是这么做。 连续语音识别,所以不再用关键词识别; 语料库,所以不是开始一段时间的搜集,但可以考虑语音分类,如男女声 可以考虑给出 N-best 的结果,再二次识别 * 无需用户进行录音训练,但是必须基于一个好的语料库,包含所有的词,然后以音素作为识别单元,利用词汇表、语法网络,实现连续语音识别。 不再是孤立词的识别,匹配的难度增加,但这里必须这么做。前面提到的非特定人语音识别也是这么做。 连续语音识别,所以不再用关键词识别; 语料库,所以不是开始一段时间的搜集,但可以考虑语音分类,如男女声 可以考虑给出 N-best 的结果,再二次识别 * 无需用户进行录音训练,但是必须基于一个好的语料库,包含所有的词,然后以音素作为识别单元,利用词汇表、语法网络,实现连续语音识别。 不再是孤立词的识别,匹配的难度增加,但这里必须这么做。前面提到的非特定人语音识别也是这么做。 连续语音识别,所以不再用关键词识别; 语料库,所以不是开始一段时间的搜集,但可以考虑语音分类,如男女声 可以考虑给出 N-best 的结果,再二次识别 * 无需用户进行录音训练,但是必须基于一个好的语料库,包含所有的词,然后以音素作为识别单元,利用词汇表、语法网络,实现连续语音识别。 不再是孤立词的识别,匹配的难度增加,但这里必须这么做。前面提到的非特定人语音识别也是这么做。 连续语音识别,所以不再用关键词识别; 语料库,所以不是开始一段时间的搜集,但可以考虑语音分类,如男女声 可以考虑给出 N-best 的结果,再二次识别 * 无需用户进行录音训练,但是必须基于一个好的语料库,包含所有的词,然后以音素作为识别单元,利用词汇表、语法网络,实现连续语音识别。 不再是孤立词的识别,匹配的难度增加,但这里必须这么做。前面提到的非特定人语音识别也是这么做。 连续语音识别,所以不再用关键词识别; 语料库,所以不是开始一段时间的搜集,但可以考虑语音分类,如男女声 可以考虑给出 N-best 的结果,再二次识别 以我们及我们的学生为主力军,以科大实验室(学生、戴老师和专门做硬件的李老师)为强有力的后盾,同时科大讯飞以及上海摩托罗拉的同学提供一些技术上的参考(三个同学在上海,两个做语音,一个转图像),我们有信心做好。 希望能够立项,给予支持,购买Arm的开发箱,一个大的语料库,以及寻求技术支持时必要的交际(电话里很难透漏技术细节) * School of Computer Information 语音信号处理 Speech Signal Processing * 语音信号处理 基础知识以及分析、处理技术(《语音信号处理》 赵力编著) 隐马尔可夫模型(《Fundamentals of Speech Recognition》 L.Rabiner 著) 专题报告 语音信号处理(参考文献) 《语音信号处理》 赵力编著 《语音信号处理》 韩纪庆编著 《Fundamentals of Speech Recognition》 L.Rabiner 著 《现代语音技术基础与应用》 蔡莲红编著 《音频信息处理》 韩纪庆编著 国际会议(ICASSP),国际期刊(speech communication) 基础知识以及分析、处理技术 语音信号处理的基础知识 语音信号的短时时域分析 线性预测分析和倒谱分析 隐马尔可夫模型 专题报告 语音信号处理 基础知识以及分析、处理技术 语音信号处理的基础知识 1.1 概述: 发音语音学、声学语音学和听觉语音学三大分支 音高、音强、音长、音色四种要素 1.2 语音生成系统及语音信号产生模型: 语音发音系统图 激励+声道+辐射模型

文档评论(0)

1亿VIP精品文档

相关文档