- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
万方数据
万方数据
分类号:
U D C :
密级:
编号:
专业硕士学位论文
(工程硕士)
基于音频分割的场景分类研究
硕 士 研 究 生 :孙立仁 指 导 教 师 :张磊教授 学 位 级 别 :工程硕士
工 程 领 域 :电子与通信工程
所 在 单 位 :信息与通信工程学院 论 文 提 交 日 期 :2014 年 5 月 30 日
论 文 答 辩 日 期 :2014 年 6 月 10 日 学 位 授 予 单 位 :哈尔滨工程大学
Classified Index: U.D.C:
A Dissertation for the Professional Degree of Master
(Master of Engineering)
Research on Audio Scene Classification Based on Audio Segmentation
Candidate: Sun Liren
Supervisor: Professor Zhang Lei
Academic Degree Applied for: Master of Engineering
Specialty: Electronics and Communications Engineering
Date of Submission: May 30, 2014
Date of Oral Examination: June 10, 2014
University: Harbin Engineering University
哈尔滨工程大学
学位论文原创性声明
本人郑重声明:本论文的所有工作,是在导师的指导下,由作者本人独立完成的。 有关观点、方法、数据和文献的引用已在文中指出,并与参考文献相对应。除文中已注 明引用的内容外,本论文不包含任何其他个人或集体已经公开发表的作品成果。对本文 的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声 明的法律结果由本人承担。
作者(签字):
日期: 年 月 日
哈尔滨工程大学 学位论文授权使用声明
本人完全了解学校保护知识产权的有关规定,即研究生在校攻读学位期间论文工作 的知识产权属于哈尔滨工程大学。哈尔滨工程大学有权保留并向国家有关部门或机构送 交论文的复印件。本人允许哈尔滨工程大学将论文的部分或全部内容编入有关数据库进 行检索,可采用影印、缩印或扫描等复制手段保存和汇编本学位论文,可以公布论文的 全部内容。同时本人保证毕业后结合学位论文研究课题再撰写的论文一律注明作者第一 署名单位为哈尔滨工程大学。涉密学位论文待解密后适用本声明。
本论文(□在授予学位后即可 □在授予学位 12 个月后 □解密后)由哈尔滨工程 大学送交有关部门进行保存、汇编等。
作者(签字): 导师(签字):
日期: 年 月 日 年 月 日
基于音频分割的场景分类研究
摘 要
随着多媒体产业的迅速发展、音频信号处理技术研究的深入、音频分割和分类技术 在现实生活中音频检索、视频分析和语音识别方面的广泛应用,音频信号的分割和分类 技术越来越得到人们在日常生活中的普遍关注。音频信号的场景分割和分类技术是音频 信号处理中一项重要的内容。音频信号的分割技术就是在一段音频文件中找到不同段落 的起始点、终点的位置,音频的场景分类技术就是在分割技术找到段落起始点和终点的 基础上,根据不同的段落特征进行场景的识别。这两项技术是语音识别中前端处理中的 最关键的技术,其性能的优劣程度必然直接影响到语音识别系统的正确率。
本文首先介绍了音频分割和分类技术研究背景及现状,之后针对所采用的语料库, 明确了音频信息中主要的音频类型,把音频分成纯语音、噪声、音乐、在背景音乐下的 语音、静音和在噪声下的语音,共六种。之后分别介绍近几年国内外学者提出的一些音 频分割算法,如固定窗长度的分割熵算法和基于贝叶斯信息准则(BIC)的音频分割算法, 并进行仿真实验说明结果,比较这两种算法在不同情况下的优点和缺点。之后本文针对 音频场景分割跳变点检测提出针对 BIC 算法的改进和实现,在低噪声条件下,能够很 好的保证系统的准确率和鲁棒性,并减少了检测时间,实现了音频场景跳变点检测系统 的高效性。由于支持向量机(SVM)能够成功的向高维空间非线性映射,本文采用支持向 量机(SVM)作为分类器,运用 K-means 聚类算法生成字典,将每一段音频场景向生成的 字典投影,从而得到每一类音频的新特征作为训练数据,根据对比出来的实验结果,说 明生成的新特征与 SVM 分类器相结合的音频场景分类方法对于基线系统的分类方法优 化了准确率。之后本文又在提取新特征上面提出了金字塔方法,进一步优化了分类系统 的准确率。文章最后对分割熵和 BIC 两种音频分
您可能关注的文档
- 基于企业网的设备监测系统的研究-控制理论与控制工程专业论文.docx
- 基于统计方法的异常数据检测及其修复-仪器仪表工程专业论文.docx
- 基于物联网技术的太阳能路灯测控系统-电子与通信工程专业论文.docx
- 基于决策树模型的我国商业银行盈利能力研究金融学专业论文.docx
- 基于系统动力学的远程医疗信息系统 风险管理研究-管理科学与工程专业论文.docx
- 基于物联网的病区智能生理参数采集系统关键技术的研究-生物医学工程专业论文.docx
- 基于数字传感器的多点测控系统研究-机械电子工程专业论文.docx
- 基于算法的X3D动画及其在灾害模拟中的应用计算机应用技术专业论文.docx
- 基于物联网平台售货机智能化的设计与研究-电子与通信工程专业论文.docx
- 基于水下无线传感器网络的AUV自组网关键技术研究-计算机系统结构专业论文.docx
- 2025年潮汐能绿色能源补贴政策及影响评估报告.docx
- 2025年医疗芯片技术专利分析报告.docx
- 2025年智慧零售门店门店绩效评估报告.docx
- 2025江西新余市公安局招聘警务辅助人员160人历年参考试题及答案解析(夺冠系列).docx
- 2025年太阳能光伏幕墙政策支持力度分析.docx
- 2025年地板行业绿色环保消费者满意度报告.docx
- 《2025年宠物殡葬服务体验升级与高端定价策略分析》.docx
- 2025江西新余市事业单位第二轮招聘优秀青年人才(博士研究生)5人历年参考题库及答案解析(名师系列).docx
- 2025年边缘计算芯片市场规模与增长趋势报告.docx
- 2025年无人机在环境监测领域的应用案例及技术创新报告.docx
最近下载
- 2025年医学课件-小脑肿瘤PPT护理查房.pptx
- 老年活动策划与组织:老年小组活动策划与组织PPT教学课件.pptx
- 抽水蓄能电站上水库工程施工组织设计.pdf VIP
- 椎管内分娩镇痛中国规范2024(附图表).pdf VIP
- 市政工程平行检验记录文本.pdf VIP
- 2025年度食品安全风险日管控、周排查、月调度记录表.pdf VIP
- (高清版)G-B∕T 36992-2019 手动牙间刷.pdf VIP
- 《一只鸟仔》(课件)人音版音乐三年级下册.ppt VIP
- 视觉传达设计专业介绍.pptx VIP
- JB_T 13649.1-2019 高速刀柄与机床主轴接口 第1部分:带有法兰接触面的空心圆锥(HSK)接口技术规范.docx VIP
原创力文档


文档评论(0)