CN100397387C 数字声音数据的摘要制作方法和设备 (新加坡科技研究局).docxVIP

  • 1
  • 0
  • 约1.25万字
  • 约 33页
  • 2026-02-20 发布于重庆
  • 举报

CN100397387C 数字声音数据的摘要制作方法和设备 (新加坡科技研究局).docx

[19]中华人民共和国国家知识产权局

[12]发明专利说专利号ZL7

[45]授权公告日2008年6月25日

[51]Int.Cl.

G06F17/00(2006.01)

明书

[11]授权公告号CN100397387C

[22]申请日2002.11.28[21]申请7

[86]国际申请PCT/SG2002/0002792002.11.28

[87]国际公布WO2004/049188英2004.6.10

[85]进入国家阶段日期2005.6.30

[73]专利权人新加坡科技研究局地址新加坡新加坡

[72]发明人徐常胜

[56]参考文献

CN1282069A2001.1.31US6225546B12001.5.1CN1112269A1995.11.22

审查员马雅凡

[74]专利代理机构永新专利商标代理有限公司代理人夏青

权利要求书3页说明书9页附图6页

[54]发明名称

数字声音数据的摘要制作方法和设备

[57]摘要

开始声音文件分割特征提取分类器分类参数摘要制作声音摘要结束摘要制作本发明涉及为数字声音原始数据自动制作摘要,更具体地说是通过从音乐帧(73、74、75、76)中提取特征以分辨纯音乐和声乐(40、60)。设计分类器,利用适应性学习/训练算法(36)决定分类参数(20),根据分类器将数字声音数据确定为纯音乐或声乐。对于纯音乐,通过计算时间性的、频谱的和倒频谱的特征将音乐内容特性化,以及使用适应性集群方法以根据计算出的特征而建构音乐内

开始

声音文件

分割

特征提取

分类器分类参数

摘要制作

声音摘要

结束

摘要制作7权利要求书第1/3页

2

1、数字声音数字声音数据摘要制作方法,包括以下步骤:

接收声音数据;

分割该数据;

提取特征,从而确定声音数据的分类参数,该声音数据具有至少一个计算出的能够体现声音数据特点的特征;

根据分类参数将声音数据分入至少纯音乐和声乐中的一种;以及

生成能代表数字声音数据摘要的声信号,其中摘要制作取决于所挑选的类别。

2、如权利要求1所述的方法,其特征在于:分割步骤还包括将声音数据分割成帧,并将帧叠加。

3、如权利要求2所述的方法,其特征在于:分类步骤还包括通过从各帧收集训练数据以及通过利用训练计算确定分类参数,将帧分类。

4、如权利要求3所述的方法,其特征在于:训练计算包括统计学的学习算法,其中统计学的学习算法是隐藏式马尔可夫模型、神经网络或支持向量机。

5、如前述任一权利要求所述的方法,其特征在于:声信号的种类为音乐。

6、如权利要求1-4任意一项所述的方法,其特征在于:声信号的种类为声乐或纯音乐。

7、如权利要求1-4任意一项所述的方法,其特征在于:计算出的特征是振幅包络、功率频谱或梅尔频率倒频谱系数。

8、如权利要求1-4任意一项所述的方法,其特征在于:根据与纯音乐或声7权利要求书第2/3页

3

乐相关的集群结果和启发式规则生成摘要。

9、如权利要求1-4任意一项所述的方法,其特征在于:计算出的特征是与纯音乐内容或声乐内容有关的线性预测系数、零交叉率或梅尔频率倒频谱系数。

10、用于为数字声音数据制作摘要的设备,包括:

特征提取器,该特征提取器用于接收声音数据并直接分析该声音数据从而确定声音数据分类参数,所述声音数据具有至少一个计算出的能够体现声音数据特点的特征;

与特征提取器联系的分割器,该分割器接收声音文件,以及将声音数据分割成帧,并为特征提取器叠加帧的分割器;

分类器,该分类器与特征提取器联系,用作根据来自特征提取器的分类参数将声音数据分入至少纯音乐和声乐中的一种;以及

和分类器联系的分类参数发生器,其中分类器通过从各帧收集训练数据并通过利用在分类参数发生器中的训练计算确定分类参数,将每一帧分类;

摘要器,该摘要器和分类器联系,用作生成能代表数字声音数据摘要的声信号,其中摘要制作取决于所挑选的类别。

11、如权利要求10所述的设备,其特征在于:训练计算包括统计学的学习算法,其中统计学的学习算法是隐藏式马尔可夫模型、神经网络或支持向量机。

文档评论(0)

1亿VIP精品文档

相关文档