- 0
- 0
- 约1.1万字
- 约 18页
- 2026-01-20 发布于重庆
- 举报
(19)国家知识产权局
(12)发明专利
(10)授权公告号CN114512118B(45)授权公告日2025.07.11
(21)申请号202210005950.8
(22)申请日2022.01.04
(65)同一申请的已公布的文献号申请公布号CN114512118A
(43)申请公布日2022.05.17
(73)专利权人澳门理工学院
地址中国澳门高美士街澳门理工学院(72)发明人柯韦许立文
G10L15/06(2013.01)
(56)对比文件
CN112669822A,2021.04.16CN112802498A,2021.05.14CN113160854A,2021.07.23审查员易婷
(74)专利代理机构珠海智专专利商标代理有限
公司44262专利代理师许为炳
(51)Int.CI.
G10L15/02(2006.01)
G10L25/18(2013.01)
G10L25/30(2013.01)权利要求书1页说明书6页附图3页
(54)发明名称
基于声音语谱图的智能分句方法、计算机装置及存储介质
(57)摘要
CN114512118B本发明提供一种基于声音语谱图的智能分句方法、计算机装置及存储介质,该方法包括:获取待分句语音数据,将待分句语音数据转化成待分句频谱图数据;根据待分句频谱图数据识别频谱静音段;获取频谱静音段之前第一预设时长的前置频谱和频谱静音段之后第二预设时长的后置频谱,将前置频谱和后置频谱组合成待识别频谱图;利用预设分类模型对待识别频谱图进行识别,确认频谱静音段的停顿类别;根据停顿类别对语音文件进行句子分割。应用本发明基于声音
CN114512118B
开始
开始
获取待分句语音数据,将待分句语音数据转化成待分句频谱图数据S1
根据待分句频谱图数据识别频谐静音段S2
获取频谱静音段之前第一预设时长的前置频谱
和频谱静音段之后第二预设时长的后置频谱,
将前置频谱和后置频谱组合成待识别频谱图
S3
利用预设分类模型对待识别频谱图进行识别,确认频谱静音段的停倾类别S4
根据停顿类别对语音文件进行句子分割S5
将分割得到的句子以预设格式存储S6
结束
CN114512118B权利要求书1/1页
2
1.一种基于声音语谱图的智能分句方法,其特征在于:包括:
获取待分句语音数据,将所述待分句语音数据转化成待分句频谱图数据;
根据所述待分句频谱图数据识别频谱静音段;
获取所述频谱静音段之前第一预设时长的前置频谱和所述频谱静音段之后第二预设时长的后置频谱,将所述前置频谱和所述后置频谱组合成待识别频谱图;
利用预设分类模型对所述待识别频谱图进行识别,确认所述频谱静音段的停顿类别;根据所述停顿类别对所述待分句语音数据进行句子分割;
其中,所述将所述前置频谱和所述后置频谱组合成待识别频谱图的步骤包括:在所述前置频谱和所述后置频谱之间增加第三预设时长的静音频谱,获得所述待识别频谱图。
2.根据权利要求1所述的基于声音语谱图的智能分句方法,其特征在于:
所述第三预设时长的取值范围为所述待识别频谱图中频谱总时长的1/5至1/4。
3.根据权利要求2所述的基于声音语谱图的智能分句方法,其特征在于:
所述第二预设时长是所述第一预设时长的三倍。
4.根据权利要求1至3任一项所述的基于声音语谱图的智能分句方法,其特征在于:
所述根据所述待分句频谱图数据识别频谱静音段的步骤包括:
当所述待分句频谱图数据中出现频率幅度小于预设值且持续预设时长时,则认为该频谱段为频谱静音段。
5.根据权利要求1至3任一项所述的基于声音语谱图的智能分句方法,其特征在于:
所述预设分类模型由卷积神经网络学习获得。
6.根据权利要求5所述的基于声音语谱图的智能分句方法,其特征在于:
所述卷积神经网络学习的步骤包括:
获取训练语音数据对应的频谱图数据;
对所述频谱图数据中所有的频谱静音段进行停顿类别标注;
获取频谱图数据中每一个的频谱静音段之前所述第一预设时长的前置频谱和所述频谱静音段之后所述第二预设时长的后置频谱组成训练频谱图;
利用卷积神经网络算法对所述训练频谱图进行模型训练,获得所述预设分类模型。
7.根据权利要求1至3任一项所述的基于声音语谱图的智能分句方法,
您可能关注的文档
- CN113870355B 一种相机的平场标定方法、装置及平场标定系统 (卡莱特云科技股份有限公司).docx
- CN113906804B 用户终端以及无线通信方法 (株式会社Ntt都科摩).docx
- CN113920511B 车牌识别方法、模型训练方法、电子设备及可读存储介质 (深圳市景阳科技股份有限公司).docx
- CN113925068B 一种翻转脱模方法 (广州浩胜食品机械有限公司).docx
- CN113950724B 在癫痫患者的脑中标识可通过手术操作的目标区的方法 (艾克斯-马赛大学).docx
- CN113950747B 显示基板及其制备方法、显示装置 (京东方科技集团股份有限公司).docx
- CN113961298B 一种页面切换方法、装置、设备及介质 (中国建设银行股份有限公司).docx
- CN113965306B 从多个处于休眠模式的小区传输参考信号的方法及其装置 (诺基亚技术有限公司).docx
- CN113988289B 基于对抗训练鲁棒的内容-风格解耦模型训练方法及系统 (上海交通大学).docx
- CN114004225B 一种医学文本词向量化方法 (山东健康医疗大数据有限公司).docx
- 2026-2030国内美体内衣行业市场发展现状及发展前景与投资机会研究报告.docx
- 2026-2030中国荧光增白剂行业深度调研及投资前景预测研究报告.docx
- 2026-2030羽毛球馆产业规划专项研究报告.docx
- 2025至2030中国生产检重秤行业调研及市场前景预测评估报告.docx
- 2026-2030植物性着色料行业市场发展分析及竞争格局与投资战略研究报告.docx
- 2026-2030中国工作服行业市场深度分析及发展预测与投资策略研究报告.docx
- 2026-2030中国复合碱行业深度调研及投资前景预测研究报告.docx
- 2025至2030工程用钢市场发展现状分析及行业细分市场及应用领域与趋势展望研究报告.docx
- 2026-2030中国基站天线行业市场发展分析及竞争形势与投资前景研究报告.docx
- 企业安全生产管理培训课件.pdf
最近下载
- 《图形制作ILLUSTRATOR设计》课程标准.doc VIP
- 肾积水护理查房.pptx VIP
- midas-GTSNX常用参数的取值.pdf VIP
- 阿特拉斯•科普柯 冷冻式干燥机.pdf VIP
- 防水工程施工部署.docx VIP
- GB-T 32439-2015给水用钢丝网增强聚乙烯复合管道_(高清).pdf
- CZ2209--92改进型50km钢轨9号单开道岔总布置图(中铁轨道系统公司2009).pdf VIP
- 变速箱知识培训.pptx VIP
- ISO 9001(DIS)-2026《质量管理体系——要求》(含附录使用指南-中文版-雷泽佳译-2025年9月10日).pdf VIP
- 中国博物馆学基础-王宏钧-考研资料.pdf VIP
原创力文档

文档评论(0)