- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
乒乓球比赛视频精彩回合剪辑的研究
乒乓球比赛视频精彩回合剪辑的研究
摘要:为快速浏览精彩的乒乓球回合,该文以背景重建为基础,在时间上运用多时间步长进行视频的自动镜头分割,在空间上通过肤色分析和四肢提取来检测并跟踪乒乓球与运动员的运动轨迹,并以此评价击球回合质量,自动提取最精彩的回合。实验证明,该文具有良好的使用性和可靠性。
关键词:镜头分割;背景重建;运动轨迹
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2014)35-8527-02
1 概述
面度众多乒乓球比赛视频,人们希望能快速浏览其中的精彩回合。乒乓球比赛中镜头切换频繁,利用普通视频剪辑工具处理效率太低。因此设计一个能自动提取并评价回合精彩程度的系统具有显著的实用价值。
运动精彩镜头提取有多种方法,如音视频融合检测[1],基于音轨分析的检测[2],基于情感激励检测方法等[3]。 文献[4]对乒乓球和运动员进行了运动跟踪以实现对镜头的评价,文献[5]进一步融合了音频信息对乒乓球精彩镜头进行检测。该文以背景重建为基础对运动员和乒乓球进行跟踪。首先是镜头检测,然后通过运动和肤色信息分析改进背景重建算法,接下来完成对运动员的跟踪,最后融合乒乓球和运动员运动以提高评价可靠性。
2 镜头分割与分类
为提高镜头检测可靠性,该文采用多时间步长联合分析,其中时间步长取1、4和8。可靠的镜头变化在相邻多个步长的曲线上都是明显的,因此将多条曲线相乘得到第四条曲线。这条乘积曲线反映了三个尺度的联合结果,具有更明显的峰谷特性,同时还能避免瞬时遮挡等突发干扰的影响。然后再通过合并相邻峰值消除突发干扰。
比赛视频由多个镜头的内容编辑而成,比较常见的镜头类型包括:主机位比赛镜头、接发球特写镜头、教练席镜头、运动员席镜头、观众席镜头、裁判镜头等。用镜头分割的结果,考虑到比赛内容的连续性,取镜头中间一帧作为关键帧。然后,利用无监督的聚类方法[7]对这些关键帧进行聚类,用户在聚类的基础上选定要保留的场景种类。
3 比赛镜头背景重建
乒乓球比赛主机位相对固定,可重建球场背景。但简单的时间平均得到的背景会包含运动员信息,图1.a和1.b是6秒和30秒视频片段重建结果,明显能看出运动员的影响。该文在重建过程中,将运动区域和肤色区域排除在外,可得到更可靠的重建结果,如图1.c所示。
利用重建背景与当前帧相减后取差值较大像素即可得到前景对象。图2.a和图2.b分别对应图1.b和图1.c的处理结果。图2.a中明显可见背景不准确的影响,会增加处理难度。如果运动员衣服颜色和背景一致,也会存在空洞现象,对后续处理产生一定的影响。
4 前景分析及评价
4.1乒乓球轨迹跟踪
乒乓球线路和速度变化是反映比赛精彩程度的重要依据。该文首先计算帧间差并确定帧间内容变化区域、定位候选乒乓球对象。然后中央位置处候选乒乓球作为跟踪起点,采用贝叶斯决策框架实现跟踪。该框架采用卡尔曼滤波器对动态建模并跟踪,采用增量贝叶斯算法来更新外观参数,最后取具有最大后验概率的候选乒乓球最为当前帧中乒乓球的最佳位置。
4.2运动员动作检测
为提高评价质量,通过分析运动员动作来判断精彩程度。乒乓球运动员四肢运动较多,在整体运动的基础上结合前景检测、肤色提取对四肢的运动进行跟踪,作为评价精彩程度的重要依据。在实现过程中选择先得到候选四肢,然后利用Bayesian决策来跟踪。
在形态处理基础上对轴线尺寸、位置、颜色做出限制,得到候选四肢。肤色像素比例越高,属于四肢的置信度越高。在轴线尺寸上,下肢尺寸比较突出,检测结果稳定;上肢则随其姿态变化较多。具体数值需根据球台尺寸和运动员位置调整。用于跟踪的主要是运动信息和外观信息,系统利用Bayesian决策框架[4]将其组合起来。使用四个Kalman滤波器对四肢分别构建动态模型。决定状态随时间进展的卡尔曼模型和测量模型分别为:
[Xk+1=AXk+wk] (1)
[Zk+1=HkXk+vk] (2)
[Xk]是包含位置和速度的状态向量,[Zk]是测度。[wk]是过程噪声,[vk]是度量噪声,都是白噪声。卡尔曼滤波器假设在每一步的后验概率密度都是高斯的,均值和方差参数是[θ=vxe,vye,σxe,σye]。[vxe]、[vye]是速率估计值,[σxe]、[σye]是速度方差估计值。每一帧更新该混合模型以最大化后验估计。对每个外观特征的高斯分布的均值和方差参数更新如下:
[μk=μk-1+μ(k)-μ(k-L+1)L-1] (3)
[k=k-1+∑(k)∑(k-L+1)L-1] (4)
4.3 回合精彩度评价
将每回合比赛中乒乓球和运动员运动信息映射到与人的感觉一致的精彩度需要专业知识
文档评论(0)