- 0
- 0
- 约8.2千字
- 约 37页
- 2026-05-20 发布于湖南
- 举报
目录
一、白皮书简介 2
二、应用场景 2
三、技术介绍 3
(一)主要功能 3
(二)核心技术特色 5
(三)接口协议 7
1.流式语音识别接口 7
2.离线语音转写接口 16
四、系统部署 21
(一)部署架构 21
(二)配置要求 21
五、公司介绍 22
一、白皮书简介
《语音识别全栈国产化技术实践白皮书》阐述了一套基于基于紫光计算机集群和摩尔线程全功能GPU进行训练与推理的语音识别解决方案。该方案包含两大核心服务:适用于实时、低延迟场景的流式语音识别,以及适用于长音频、批量转写场景的离线语音转写。每个服务均自带完整音频预处理与后处理能力(VAD、ASR、标点生成与文本归一化ITN),同时该方案支持热词增强与垂直领域语言模型定制,输出可选字级时间戳与句子级时间戳,满足实时转写、检索索引和高精度后处理需求。该系统已通过国家工业信息安全发展研究中心的检测(即“国检”),并持有相应的检测报告与证书,验证了其在多种噪声环境下的稳定性与识别准确性。
二、应用场景
1.电话客服质检与话单转写:支持大批量录音离线转写与准实时的通话监控,便于质检、关键词抽取与话单归档。
2.会议与访
原创力文档

文档评论(0)