IVA音视频识别技术解析.docx

  1. 1、本文档共1页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

IVA音视频识别技术解析

随着全球触屏时代的到来,交流平台的移动化、社交化、智能化已成为必然的发展方向。在这样的趋势下,视频互动成为视频行业制定战略的最新重要考虑因素。下面重点介绍下在欧美近两年最受关注的IVA技术。 IVA

是InVideoAction 技术的缩写,IVA目前与GoogleVoice的字幕自动化生成技

术、百度VideoIn视频无痕植入技术并称改变视频行业的三大革命性技术。随着触屏时代的到来,交流平台的移动化、社交化、智能化已成为必然

的发展方向。在这样的趋势下,视频互动成为视频行业制定战略的重要考虑因

素。

IVA技术简单来说是一种音视频识别技术,加上一套互动工具所构成的

互动体系。识别技术就像一个探头,能够寻找视频中拨动心弦(或人为设定)的时刻,并用互动技术实现与观众的互动共鸣。值得一提的是,IVA技术可将直播视频画面中的人物、物体、品牌、纹理、场景甚至情绪等信息分拣出来,再通过各种互动工具与受众进行双向交流。

IVA的使命分三个层次,初级IVA、中级IVA、高级IVA。

其中,初级IVA是依据音视频样本库标记视频流中与样本库匹配的视频片断,比如从视频流中识别广告时段和广告主、识别新闻联播等节目的片头、根据录音识别用户正在观看的节目等。

中级IVA利用图像处理技术、大数据技术和深度学习技术,识别视频流中的场景、形状、纹理和人物等。中级IVA可以从视频流中识别大海、森林、闹市等多达200多种场景,在场景连续出现超过30帧的情况下,识别率可以高达90%以上;形状识别的典型案例是从视频流中准确识别1000多种饮料瓶的

文档评论(0)

hao187 + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

认证主体武汉豪锦宏商务信息咨询服务有限公司
IP属地湖北
统一社会信用代码/组织机构代码
91420100MA4F3KHG8Q

1亿VIP精品文档

相关文档