- 1、本文档共64页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘要基于内容的音频信号分析处理在多媒体信息处理中占有很重要的地位,它要
摘要
基于内容的音频信号分析处理在多媒体信息处理中占有很重要的地位,它要 求区分不同的音频类别并对其进行不同的处理,而这些在很大程度上都依赖于音 频自动分类技术的发展。音频分类技术是音频深度处理和音频结构化的基础,是 基于内容的音视频检索、辅助视频分析等应用的关键,在视频自动处理系统和其 他多媒体应用系统中有着广泛的应用。
本文在认真总结前人研究成果的基础上,深入考察了新闻音频信息的语义内 容,对层次化音频结构框架进行分析,并对不同层次的音频结构单元做出定义。 基于音频信息的内容和结构特点,确定了新闻音频中主要的音频类型:静音、纯 音乐、男主持人语音、女主持人语音、现场报道和男女主持人对话六类,并针对 音频特征分析与抽取、音频分类和基于Divergence Shapel}巨离的语音聚类等三个
方面的问题提出相应得解决方案。
首先从帧层次上和片段层次上深入研究了不同类别音频之间的特征,并针对 上述提出的六种音频类别,提出了静音比例、过零率标准偏差、中心频率标准偏 差、基音频率标准偏差和美尔倒频谱系数一阶差分美尔倒频谱系数五类片段特 征作为音频分类器的输入,通过实验验证了抽取的特征集在本文提出的分类器中 的分类性能。
其次,本文根据模式识别理论设计了音频分类的技术流程,并对其中所涉及 到的关键技术进行了探讨。着重对隐马尔科夫分类器进行了深入地研究,并根据 新闻音频类别的特点,提出一种基于规则和基于隐马尔科夫的音频分层分类算 法,通过实验分析了该算法的分类性能。
最后,为了对不同说话人的语义内容进行更深入地理解,本文在分类结果的 基础上,提出了基于Divergence S11ape距离的聚类方法,尝试对主持人的语音进 行跟踪聚类,通过实验较好的聚类了不同主持人的语音。
关键词:新闻视频分析音频分类隐马尔科夫模型音频片段特征抽取聚类
ABSTRACTContent.based
ABSTRACT
Content.based audio signal analysis is one of the most important parts m multimedia processing,which needs to discriminate different types and deal with
th锄in different methods.Audio classification plays all important role m it and IS
base wrork of alldio content analysis and audio structuring.It is widely applied in content.based audio/video retrieval and other multimedia application systems·
Based on the development of past research,this paper deeply explores the audio senlantic content of the news program,analyses and defines audio structure umts on、 di雠rent hierarchies.According tO the characters of news audio structure and COntent, six audio types in news program are defined: silence,pure_muslc, ancho咖an/arlcho刑oman pure speech,live report and alternated speech.This paper
s01ves the following problems: audio feature analysis and extraction, audio
classification and speech tracking clustering based On divergence shape distance· First.discriminating features among different audio types are researched on
frame and clip level respectively.According tO the six audio types,the paper proposes
five clip features.such as silence ratio,zero c
您可能关注的文档
- 面向对象的钢筋混凝土结构非线性有限元分析-结构工程专业毕业论文.docx
- 慢病毒介导转基因小鼠胚胎的初步研究-预防兽医学专业毕业论文.docx
- 绿色病房楼-建筑技术科学专业毕业论文.docx
- 酶法糖化白蛋白测定及其在妊娠期糖尿病的临床意义-妇产科学专业毕业论文.docx
- 棉铃虫氨肽酶N毒素结合区片段对Cry1Ac增效的研究-农药学专业毕业论文.docx
- 论转型时期我国电视传媒业的制度创新-产业经济学专业毕业论文.docx
- 绿色施工技术与评价体系研究-结构工程专业毕业论文.docx
- 铝合金电阻点焊熔核质量强化研究-材料加工工程专业毕业论文.docx
- 霉豆渣粑发酵过程中营养及风味成分变化研究-农产品加工及贮藏工程专业毕业论文.docx
- 民事审前法院调解程序研究-法律学专业毕业论文.docx
- 2025年蛋形镜项目市场调查研究报告.docx
- 2025至2030年中国七氟丙烷市场分析及竞争策略研究报告.docx
- 2025年中央空调智能控制系统项目市场调查研究报告.docx
- 2025年袋装红茶项目市场调查研究报告.docx
- 2025至2030年中国卧式四柱液压机市场分析及竞争策略研究报告.docx
- 2025至2030年中国全合金螺旋直刀市场分析及竞争策略研究报告.docx
- 2025至2030年中国医疗仪器液晶显示器市场分析及竞争策略研究报告.docx
- 2025至2030年中国黄吸头市场分析及竞争策略研究报告.docx
- 2025年中国径向外充128极线圈数据监测研究报告.docx
- 2025至2030年中国GPS汽车卫星导航仪市场分析及竞争策略研究报告.docx
文档评论(0)