- 181
- 0
- 约1.08万字
- 约 23页
- 2018-04-01 发布于江西
- 举报
PocketSphinx语音识别系统语言模型的训练和声学模型的改进
PocketSphinx语音识别系统语言模型的训练和声学模型的改进
一、训练语言模型
?????? 词与词之间存在着合乎句法与否的约束,语言模型就是用来表示这些约束的,它可以提供字与字之间的上下文信息和语义信息。在pocketsphinx语音识别系统时,采用了N-gram模型,即对训练音频文件所对应的文本文件进行统计,提取不同字词之间先后发生的统计关系。
?????? 如果你的语言模型较小(例如小的语音指令集或者任务),而且是英文的,那就可以直接上CMU提供的网络服务器上面训练,如果较大的话,一般使用CMUclmtk语言模型工具来训练。下面分两种情况来介绍:
?
1.1、利用在线工具建立语言模型
(1)创建一个语料库:
语料库实际上就是一些文本的集合,包含了你需要识别的语音的文字的一些集合,例如句子啊,词啊等等。
#vi corpus.txt
输入如下内容:
stop
forward
backward
turn right
turn left
保存退出
(2)利用在线工具LMTool建立语言模型:
?????? 进入网址:/tools/lmtool.html
点击Browse按钮,选择之前创建的corpus.txt,最后点击COMPILE KNOWLEDGE BASE?。这样就会生成字典文件* .dic?和语言模型文件?*.lm,例如:
生成TAR2916.tar.gz
tar xzf TAR2916.tar.gz
2916.corpus 2916.lm 2916.bo 2916.vocab
2916.dic 2916.sent 2916.token
真正有用的是.dic、.lm?的文件
(3)测试结果:
pocketsphinx_continuous解码器用-lm选项来指定要加载的语言模型,-dict来指定要加载的字典。
#pocketsphinx_continuous -lm 2916.lm -dict 2916.dic
INFO: ngram_search_fwdflat.c(295): Utterance vocabulary contains 1 words
INFO: ngram_search_fwdflat.c(912): 97 words recognized (2/fr)
INFO: ngram_search_fwdflat.c(914): 2342 senones evaluated (38/fr)
INFO: ngram_search_fwdflat.c(916): 1011 channels searched (16/fr)
INFO: ngram_search_fwdflat.c(918): 167 words searched (2/fr)
INFO: ngram_search_fwdflat.c(920): 47 word transitions (0/fr)
WARNING: ngram_search.c, line 1087: /s not found in last frame, using sil instead
INFO: ngram_search.c(1137): lattice start node s.0 end node sil.56
INFO: ps_lattice.c(1228): Normalizer P(O) = alpha(sil:56:60) = -341653
INFO: ps_lattice.c(1266): Joint P(O,S) = -341653 P(S|O) = 0
000000000: STOP (-6531224)
READY....
Listening...
?
1.2、训练大文本数据的语言模型
??????? 我们通过语言模型训练工具CMUCLMTK统计大量文本数据得到以单个词建立的N-Gram模型。
语言模型训练工具的说明见:
/SLM/toolkit_documentation.html
具体的步骤如下:(得先安装语言模型训练工具CMUCLMTK,安装过程在上一博文中)
(1)准备训练的文本,也就是语料库:
??????? 这里只是举一个例子,所以语料库也不大,而一般的语料库都是由大文本来组成的,里面就是有一些我们的日常用语或者报纸啊,书啊等等所出现过的句子。文本数据越大,训练得到的语言模型就越好。
#vi weather.txt
在?.txt中输入如下内容,记住结尾不可留“\n”(实验证明了这一点)。每个utterances?由?s和?/s?来分隔
s?天气?/s
s?有雨?/s
s?晴朗?/s
s?多云?/s
s?雷电?/s
wq?保存退出
(2)产生词汇表vocabulary文件:
# text2wfreq weather.txt |
您可能关注的文档
- GSM基站勘察及天线培训资料.ppt
- GSM无线网络规划流程0719.ppt
- GSM多载波功放基站放大器.ppt
- GSM数字拉远系统设备推广要点(郑全战).ppt
- H 风险管理报告体系设计.doc
- GSM网络规划和优化-基站勘察选点.ppt
- G建筑室内设计Ⅱ.ppt
- H225,H245协议简介.ppt
- Haier海尔公司发展SWOT分析.ppt
- HaPaMe商务3D互动技术服务.ppt
- 2025年全国演出经纪人员资格认定考试试卷带答案(研优卷).docx
- 2025年全国演出经纪人员资格认定考试试卷完整版.docx
- 2025年全国演出经纪人员资格认定考试试题库及完整答案.docx
- 2025年全国演出经纪人员资格认定考试试卷完美版.docx
- 2025年全国演出经纪人员资格认定考试试卷含答案(实用).docx
- 2025年全国演出经纪人员资格认定考试试卷及答案(各地真题).docx
- 2025年下半年内江市部分事业单位公开考试招聘工作人员(240人)备考题库附答案.docx
- 2025年全国演出经纪人员资格认定考试试卷及答案1套.docx
- 2025年下半年四川成都市郫都区面向社会引进公共类事业单位人员2人备考题库最新.docx
- 2025年下半年内江市部分事业单位公开考试招聘工作人员(240人)备考题库附答案.docx
最近下载
- 我有友情要出租ppt.pptx VIP
- 2018年4月自考30002幼儿园教育活动设计与组织试卷及答案解释.doc VIP
- 2026年湖南国防工业职业技术学院单招职业技能考试题库附参考答案详解(综合题).docx VIP
- 九年级语文下册教学课件《短文两篇》.pptx VIP
- 反应粘结型高分子湿铺防水卷材施工工法.docx VIP
- 2026年湖南国防工业职业技术学院单招职业技能考试题库带答案详解(模拟题).docx VIP
- 拿来可用的管培生实施方案.docx VIP
- 沪教牛津版七年级(初一)下册全册单词表.pdf VIP
- 2026年湖南国防工业职业技术学院单招职业技能考试题库附参考答案详解(培优).docx VIP
- 美容院选址、开业、运营管理成功秘诀+美容店成功经营管理实务手册.doc VIP
原创力文档

文档评论(0)