网站大量收购独家精品文档,联系QQ:2885784924

面向新闻视频检索的音频分类算法-信号与信息处理专业毕业论文.docx

面向新闻视频检索的音频分类算法-信号与信息处理专业毕业论文.docx

  1. 1、本文档共64页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘要基于内容的音频信号分析处理在多媒体信息处理中占有很重要的地位,它要 摘要 基于内容的音频信号分析处理在多媒体信息处理中占有很重要的地位,它要 求区分不同的音频类别并对其进行不同的处理,而这些在很大程度上都依赖于音 频自动分类技术的发展。音频分类技术是音频深度处理和音频结构化的基础,是 基于内容的音视频检索、辅助视频分析等应用的关键,在视频自动处理系统和其 他多媒体应用系统中有着广泛的应用。 本文在认真总结前人研究成果的基础上,深入考察了新闻音频信息的语义内 容,对层次化音频结构框架进行分析,并对不同层次的音频结构单元做出定义。 基于音频信息的内容和结构特点,确定了新闻音频中主要的音频类型:静音、纯 音乐、男主持人语音、女主持人语音、现场报道和男女主持人对话六类,并针对 音频特征分析与抽取、音频分类和基于Divergence Shapel}巨离的语音聚类等三个 方面的问题提出相应得解决方案。 首先从帧层次上和片段层次上深入研究了不同类别音频之间的特征,并针对 上述提出的六种音频类别,提出了静音比例、过零率标准偏差、中心频率标准偏 差、基音频率标准偏差和美尔倒频谱系数一阶差分美尔倒频谱系数五类片段特 征作为音频分类器的输入,通过实验验证了抽取的特征集在本文提出的分类器中 的分类性能。 其次,本文根据模式识别理论设计了音频分类的技术流程,并对其中所涉及 到的关键技术进行了探讨。着重对隐马尔科夫分类器进行了深入地研究,并根据 新闻音频类别的特点,提出一种基于规则和基于隐马尔科夫的音频分层分类算 法,通过实验分析了该算法的分类性能。 最后,为了对不同说话人的语义内容进行更深入地理解,本文在分类结果的 基础上,提出了基于Divergence S11ape距离的聚类方法,尝试对主持人的语音进 行跟踪聚类,通过实验较好的聚类了不同主持人的语音。 关键词:新闻视频分析音频分类隐马尔科夫模型音频片段特征抽取聚类 ABSTRACTContent.based ABSTRACT Content.based audio signal analysis is one of the most important parts m multimedia processing,which needs to discriminate different types and deal with th锄in different methods.Audio classification plays all important role m it and IS base wrork of alldio content analysis and audio structuring.It is widely applied in content.based audio/video retrieval and other multimedia application systems· Based on the development of past research,this paper deeply explores the audio senlantic content of the news program,analyses and defines audio structure umts on、 di雠rent hierarchies.According tO the characters of news audio structure and COntent, six audio types in news program are defined: silence,pure_muslc, ancho咖an/arlcho刑oman pure speech,live report and alternated speech.This paper s01ves the following problems: audio feature analysis and extraction, audio classification and speech tracking clustering based On divergence shape distance· First.discriminating features among different audio types are researched on frame and clip level respectively.According tO the six audio types,the paper proposes five clip features.such as silence ratio,zero c

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档