基于AI技术得媒资内容管理系统平台.pdfVIP

  • 2
  • 0
  • 约3.06千字
  • 约 8页
  • 2020-07-09 发布于天津
  • 举报
实 用 标 准 文 案 基于 AI 技术的媒资内容管理平台 语音识别需求书 精彩文档 实 用 标 准 文 案 2017 年 11 月 精彩文档 实 用 标 准 文 案 文档信息 产品名称 项目需求确认书 产品负责人 徐志亮 负责人联系方式 51472 文档修改记录 版本 修改时间 修改人 修改章节 修改说明 精彩文档 实 用 标 准 文 案 目 录 1. 简介 错误 !未定义书签。 2. 产品需求 5 2.1 、产品需求概述 5 2.1.1 、视频预处理 6 2.1.2 、语音识别文字输出 6 2.1.3 高识别率 7 2.1.4 支持多种音频格式 7 2.1.5 多语言识别 7 2.1.5 高识别效率 7 3. 其他需求 7 3.1 服务器环境配置 错误 ! 未定义书签。 3.2 测试需求 7 3.3 运维保障需求 错误 ! 未定义书签。 精彩文档 实 用 标 准 文 案 1. 简介 1.1. 项目背景 随着计算机自动化技术的发展,语音识别、字幕识别、场景分割等技术已经 日趋成熟,智能语义分析、智能素材关联、人脸识别技术也在迅速发展,日本 NHK 等发达国家已实际应用。 SMG 的自动编目可从语音识别和字幕识别入手, 以新闻、戏曲类节目为切人点, 在节目素材入库媒资时将语音和字幕自动进行文 字化,减少编目人员工作量。之后,以自动场景分割技术为基础,结合智能语义 分析,逐步对节目和素材实现全自动的标引, 提高整个媒资编目的自动化率, 降 低媒资运营的人工成本。 2. 产 品需求 2.1 、产品需求概述 随着计算机自动化技术的发展,语音识别、字幕识别、场景分割等技术已经 日趋成熟,智能语义分析、智能素材关联、人脸识别技术也在迅速发展,日本 NHK 等发达国家已实际应用。 SMG 可从语音识别入手, 在节目素材入库媒资时 将语音和字幕自动进行文字化。 之后, 以自动场景分割技术为基础, 结合智能语 义分析,逐步对节目和素材实现全自动的标引。 该项目的目标是通过语音识别, 对视频进行文字内容和关键词的提取, 提取 后的内容和关键词按照视频名称和视频时间信息进行存储, 最终为用户提供文字 精彩文档 实 用 标 准 文 案 内容和关键词的检索服务。 2.1.1 、视频预处理 视频预处理主要实现对视频进行提取音频视频提取音频, 从视频文件中提取 音频文件,音频格式为( mp3 或 wav )。 2.1.2 、语音识别文字输出 自动识别音、视频(包括主流格式高、低码格式)中的语音,并将其识别为 文本内容,并页面中展示。

文档评论(0)

1亿VIP精品文档

相关文档