- 2
- 0
- 约3.06千字
- 约 8页
- 2020-07-09 发布于天津
- 举报
实 用 标 准 文 案
基于 AI 技术的媒资内容管理平台
语音识别需求书
精彩文档
实 用 标 准 文 案
2017 年 11 月
精彩文档
实 用 标 准 文 案
文档信息
产品名称 项目需求确认书
产品负责人 徐志亮
负责人联系方式 51472
文档修改记录
版本 修改时间 修改人 修改章节 修改说明
精彩文档
实 用 标 准 文 案
目 录
1. 简介 错误 !未定义书签。
2. 产品需求 5
2.1 、产品需求概述 5
2.1.1 、视频预处理 6
2.1.2 、语音识别文字输出 6
2.1.3 高识别率 7
2.1.4 支持多种音频格式 7
2.1.5 多语言识别 7
2.1.5 高识别效率 7
3. 其他需求 7
3.1 服务器环境配置 错误 ! 未定义书签。
3.2 测试需求 7
3.3 运维保障需求 错误 ! 未定义书签。
精彩文档
实 用 标 准 文 案
1. 简介
1.1. 项目背景
随着计算机自动化技术的发展,语音识别、字幕识别、场景分割等技术已经
日趋成熟,智能语义分析、智能素材关联、人脸识别技术也在迅速发展,日本
NHK 等发达国家已实际应用。 SMG 的自动编目可从语音识别和字幕识别入手,
以新闻、戏曲类节目为切人点, 在节目素材入库媒资时将语音和字幕自动进行文
字化,减少编目人员工作量。之后,以自动场景分割技术为基础,结合智能语义
分析,逐步对节目和素材实现全自动的标引, 提高整个媒资编目的自动化率, 降
低媒资运营的人工成本。
2. 产 品需求
2.1 、产品需求概述
随着计算机自动化技术的发展,语音识别、字幕识别、场景分割等技术已经
日趋成熟,智能语义分析、智能素材关联、人脸识别技术也在迅速发展,日本
NHK 等发达国家已实际应用。 SMG 可从语音识别入手, 在节目素材入库媒资时
将语音和字幕自动进行文字化。 之后, 以自动场景分割技术为基础, 结合智能语
义分析,逐步对节目和素材实现全自动的标引。
该项目的目标是通过语音识别, 对视频进行文字内容和关键词的提取, 提取
后的内容和关键词按照视频名称和视频时间信息进行存储, 最终为用户提供文字
精彩文档
实 用 标 准 文 案
内容和关键词的检索服务。
2.1.1 、视频预处理
视频预处理主要实现对视频进行提取音频视频提取音频, 从视频文件中提取
音频文件,音频格式为( mp3 或 wav )。
2.1.2 、语音识别文字输出
自动识别音、视频(包括主流格式高、低码格式)中的语音,并将其识别为
文本内容,并页面中展示。
您可能关注的文档
最近下载
- 2025年设备监理师设备合同价款调整事件的处理专题试卷及解析.pdf VIP
- 2025年江门市直遴选考试真题汇编及答案解析(夺冠).docx VIP
- (高清版)DB13∕T 2936-2019 浆砌石工程检测技术规程.docx VIP
- 12D8 河北《 内线工程》标准图集.docx VIP
- 肺囊肿的症状ppt模板.pptx VIP
- 去甲肾上腺素的护理措施.doc VIP
- 2024年江门市直遴选笔试真题汇编含答案解析(夺冠).docx VIP
- 房建项目施工进度计划管理.docx VIP
- 建筑工程内业资料全套范本(表格类).doc VIP
- 内蒙古民族大学《计算机基础与C语言》2024-----2025学年期末试卷(A卷).pdf VIP
原创力文档

文档评论(0)