- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 108304385 A
(43)申请公布日
2018.07.20
(21)申请号 201810135187.4
(22)申请日 2018.02.09
(71)申请人 叶伟
地址 200126 上海市浦东新区耀华路560号
204室
(72)发明人 叶伟
(74)专利代理机构 上海伯瑞杰知识产权代理有
限公司 31227
代理人 孟旭彤
(51)Int.Cl.
G06F 17/27(2006.01)
G06F 17/30(2006.01)
G06K 9/62(2006.01)
G10L 15/26(2006.01)
权利要求书2页 说明书3页 附图3页
(54)发明名称
一种语音识别文本纠错方法及装置
(57)摘要
一种语音识别文本纠错方法,该方法包括:
生成用户词典库;生成候选待纠错文本集合;生
成候选纠错后文本集合;以及对候选纠错后文本
集合进行筛选,获得纠错后文本。本发明的实施
例通过建立用户语料库的技术特征,构建出纠错
后文本的判断模型,生成候选纠错后文本;并且
建立用户语句预测模型,利用该模型,计算得到
语音识别的纠错后文本,获得的有益效果之一
是,在智能家居控制领域,为智能家电的语音识
别控制的准确性提供了更进一步的实现方案。
A
5
8
3
4
0
3
8
0
1
N
C
CN 108304385 A 权 利 要 求 书 1/2页
1.一种语音识别文本纠错方法,其特征在于,该方法包括:
生成用户词典库;
生成候选待纠错文本集合;
生成候选纠错后文本集合;以及
对候选纠错后文本集合进行筛选,获得纠错后文本。
2.如权利要求1所述语音识别文本纠错方法,其特征在于,生成用户词典库的步骤包
括:
收集用户文本语料,并进行整理;
对整理后的语料文本进行分词和去除停用词;
对分词结果进行词性标注、词频统计、拼音标注后构建用户词典库。
3.如权利要求1所述语音识别文本纠错方法,其特征在于,生成候选待纠错文本集合的
步骤包括:
对语音识别文本进行分词、去除停用词后,获得各分词结果;
检查各分词是否在用户词典库中,若在用户词典库中出现,则所述语音识别文本不作
为候选待纠错文本,若不在用户词典库中,则所述语音识别文本作为候选待纠错文本。
4.如权利要求1所述语音识别文本纠错方法,其特征在于,生成候选纠错后文本集合的
步骤包括:
根据训练样本,生成判断用户词典库中各词是否是候选纠错后文本的判断模型,其中
将编辑距离作为模型输入特征;
将所有候选纠错后文本替换掉待纠错文本,从而生成候选纠错后文本。
5.如权利要求1所述语音识别文本纠错方法,其特征在于,对候选纠错后文本集合进行
筛选后获得纠错后文本的步骤包括:
将统计获得的用户数据,作为原始输入参数,将用户语料意图及实体作为输出,构建用
户语句预测模型;
利用用户语句预测模型,将语音识别文本的包括语音交互时间的原始参数输入,从而
获得预测得到的用户意图及实体;
将预测所得到的用户意图及实体与候选纠错后文本进行相似度计算,得到相似度最高
的候选纠错后文本作为唯一纠错后文本。
6.如权利要求4所述语音识别文本纠错方法,其特征在于,候选纠错后文本判断模型的
构建步骤包括:
整理原始语音识别文本;
人工对原始语音识别文本进行纠错,并记录下各纠错后文本;
您可能关注的文档
- CN201721624229-一种基于蓝牙Mesh及语音控制的智能家居控制系统.pdf
- CN201721631406-离线语音识别智能家居主控电路.pdf
- CN201721643066-一种智能高效的LED芯片照明装置.pdf
- CN201721668950-基于电力载波通信的智能家居控制系统.pdf
- CN201721673978-一种家庭厨房烹饪智能检测装置.pdf
- CN201721757016-一种智能语音控制中枢装置、路由器以及语音交互系统.pdf
- CN201721759846-带体感功能的智能家居管家中控设备.pdf
- CN201721767878-一种智能台灯及其系统.pdf
- CN201721795819-基于音频感应的智能家居控制面板.pdf
- CN201721795825-一种新型智能家居控制系统.pdf
- CN201810138746-一种基于语音控制的智能家居装置.pdf
- CN201810149195-智能家居控制方法、装置、系统及电子设备.pdf
- CN201810157276-一种智能家居分布式语音控制方法及系统.pdf
- CN201810159756-智能家居设备控制的方法、智能语音终端和网络设备.pdf
- CN201810165510-一种基于物联网的智能配电箱及其控制方法.pdf
- CN201810169308-基于压缩感知的P300脑机接口在智能家居中的应用方法.pdf
- CN201810186347-智能家居系统及其智能插座.pdf
- CN201810186950-离线调用家庭信息的方法及装置.pdf
- CN201810187424-一种基于语音指令控制的智能音箱及其控制方法.pdf
- CN201810187426-一种具有手势控制功能的语音控制终端及其控制方法.pdf
最近下载
- 2025光伏行业产能过剩内卷竞争现状及未来展望分析报告.pdf
- 中建设计常规做法及指标汇编(2022年,934页).pdf VIP
- 2025年国庆节假期安全教育PPT课件.pptx VIP
- 医疗器械唯一标识管理制度(UDI).docx VIP
- 《成人腰大池引流护理》(TCRHA 069-2024).pdf VIP
- 营销策划 -MINI品牌中国小红书内容种草策略分享-运营思路V2-小红书汽车.pdf
- 中小学生世界粮食日节约粮食主题班会PPT课件.pptx VIP
- 幼儿园保育技能基本功大赛试题.docx VIP
- 土木工程材料1.2 材料与水有关的性质XQ.ppt VIP
- 剑桥KET2025最新考试真题(标准真题版TEST3-阅读和写作部分-含答案及详细解析).pdf VIP
文档评论(0)