- 0
- 0
- 约4.34万字
- 约 49页
- 2026-01-26 发布于重庆
- 举报
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号CN119296516A(43)申请公布日2025.01.10
(21)申请号202411807582.4
(22)申请日2024.12.10
(71)申请人中科南京人工智能创新研究院
地址211135江苏省南京市江宁区创研路
266号麒麟人工智能产业园3号楼3楼
(72)发明人吴浩然郭紫杰徐波
(74)专利代理机构北京中先生知识产权代理事务所(普通合伙)16063
专利代理师蔡冬婷
(51)Int.CI.
G1OL15/02(2006.01)
G1OL15/04(2013.01)
G10L15/06(2013.01)
G10L15/16(2006.01)
G10L15/183(2013.01)
G10L15/18(2013.01)G10L15/26(2006.01)GO6F16/31(2019.01)GO6F16/334(2025.01)GO6F16/36(2019.01)
权利要求书4页说明书19页附图3页
(54)发明名称
基于RAG的领域化语音识别方法及系统
(57)摘要
CN119296516A本发明公开了一种基于RAG的领域化语音识别方法及系统,该方法包括获取原始领域文档集,通过主题分类、段落切分和句子切分构建分层文档结构,执行向量化处理生成多粒度向量矩阵集,建立层次化知识向量索引结构;对实时音频流进行多尺度时频分析,提取并增强声学特征,生成多尺度特征张量;对特征张量执行自适应分块和递进式注意力处理,构建概率估计模型,生成候选文本序列;基于多维查询向量在知识索引中执行多层检索,生成相关知识片段;对特征进行空间映射和动态注意力处理,执行概率优化解码得到最终识别文本。本发明通过知识增
CN119296516A
步51.获取原始领域文档集,对原始领域文档集进行主票分类,获得主想美别集;对
步51.获取原始领域文档集,对原始领域文档集进行主票分类,获得主想美别集;对主飘美别集进行段著切分,得到段落集;对段落集进行句子切分,得到句子集;将主题类别集、段落集、句子集整合,生成分层文档结构;对分层文档结构中各层文本进行向量化处理,生成多粒度向量矩阵集;基于多粒度向量矩阵集,构建检索
索引结构;
学砝取交时高统证产对高盖持证量备行整时数分5;特盛产下文特描证:篝条叉聘趋牌写多尺度频谐特征融合压结,轴出多尺度特征张量;
步骤53、对多尺度特征张量执行自适应分块处理,得到特征分块序列;对特征分块序列计算递进式注意力,得到注意力特征序列:基于注意力特征序列,构建概率估计模型,生成层次概率矩阵集;对层次概率矩阵集执行多束解码,得到候选文本序列集合;
步擅54.对候选文本序列集合进行多维度特征表示,生成多维查询向量;基于多维查询向量,在层次化知识向量索引结构中执行多层检索,得到多层检索结果集;基于多层检索结果集和候选文本序列集合,计算多维相关度,得到排序后知说片段集;对排序后知识片段集执行上下文优化,生成相关知识片段集;
步擅55、基于多尺度特征张量和相关知识片段集,进行空间映射,得到统一特征空间矩阵;对统一特征空同矩阵执行动态注意力计算,得到融合特征张量;对融合特征张量进行上下文增强编码,得到增强特征矩阵;对增强特征矩阵执行概率优化解码,得到最终识别文本,
CN119296516A权利要求书1/4页
2
1.基于RAG的领域化语音识别方法,其特征在于,包括如下步骤:
S1、获取原始领域文档集,对原始领域文档集进行主题分类,获得主题类别集;对主题类别集进行段落切分,得到段落集;对段落集进行句子切分,得到句子集;将主题类别集、段落集、句子集整合,生成分层文档结构;对分层文档结构中各层文本进行向量化处理,生成多粒度向量矩阵集;基于多粒度向量矩阵集,构建检索索引,得到层次化索引结构;将层次化索引结构与分层文档结构结合,构建层级映射关系,输出层次化知识向量索引结构;
S2、获取实时音频流,对实时音频流进行多尺度时频分析,生成多尺度频谱特征;基于多尺度频谱特征,提取声学特征,得到增强特征集;对增强特征集进行上下文编码,得到上下文特征矩阵;将上下文特征矩阵与多尺度频谱特征融合压缩,输出多尺度特征张量;
S3、对多尺度特征张量
您可能关注的文档
- CN119299676A 视频滤波方法和装置 (腾讯美国有限责任公司).docx
- CN119299672A 图像编码-解码方法以及存储介质 (英迪股份有限公司).docx
- CN119299670A 图像编码-解码方法以及存储比特流的记录介质 (韩国电子通信研究院).docx
- CN119299669A 图像编码-解码方法以及存储比特流的记录介质 (韩国电子通信研究院).docx
- CN119299668A 图像编码-解码方法以及存储比特流的记录介质 (韩国电子通信研究院).docx
- CN119299577A 图像处理装置、存储介质以及控制方法 (佳能株式会社).docx
- CN119299393A 一种通信数据传输及临时保存方法、装置及存储介质 (郭靖芳).docx
- CN119299327A 一种基于图神经网络的孪生网络性能预测方法、装置及存储介质 (南京信息工程大学).docx
- CN119299214A 一种基于日志的apt攻击检测与溯源方法 (哈尔滨工业大学).docx
- CN119299064A 定位方法、终端及网络侧设备 (维沃移动通信有限公司).docx
- 中国国家标准 GB/Z 41305.6-2026环境条件 电子设备振动和冲击 第6部分:利用螺旋桨式飞机运输.pdf
- 《GB/T 46969-2025中国图书馆机读规范数据格式》.pdf
- 《GB/T 12903-2025个体防护装备术语》.pdf
- 2025至2030中国负载测试工具行业细分市场及应用领域与趋势展望研究报告.docx
- 2025至2030中国钨(VI)氟化物气体市场竞争格局及未来需求趋势分析报告.docx
- 2025至2030中国医用隔离膜产品行业调研及市场前景预测评估报告.docx
- 2025至2030中国铜材市场经营模式分析及竞争趋势预测报告.docx
- 2025至2030中国氙气试验箱行业调研及市场前景预测评估报告.docx
- 2025-2030中国PDLC智能调光膜市场产销需求与竞争前景分析研究报告.docx
- 2025至2030中国电子稳压器行业市场深度研究与战略咨询分析报告.docx
最近下载
- 老年人群维生素D营养评估及补充中国专家共识2025版.pptx
- 布拖县小洞子储量核实分析方案(9).pdf
- 快手【马年大集】逛大集赏民俗-招商方案.docx VIP
- 10000字在学校挨机器人板子的作文.docx VIP
- 实施指南(2026)《DLT 1815-2018 电化学储能电站设备可靠性评价规程》.pptx VIP
- 北师大版五年级上册数学计算题.pdf VIP
- SYT 6597-2018 油气管道内检测技术规范.docx VIP
- 牧原股份-市场前景及投资研究报告:龙头振翼.pdf VIP
- 工业机器人工作站系统集成(ABB) IRB120机器人 T-01-O-A-IRB120机器人主要参数.docx VIP
- (正式版)DB61∕T 1757-2023 《电化学储能电站安全风险评估规范》.docx VIP
原创力文档

文档评论(0)