音色空间音高依存性考虑.ppt

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
音色空間の音高依存性を考慮した 楽器音の音源同定 北原 鉄朗? 後藤 真孝?? 奥乃 博? ?京都大学大学院情報学研究科知能情報学専攻 ??科技団さきがけ21/産業技術総合研究所 発表の流れ 音源同定とは 音色空間の音高依存性を考慮した 音源同定手法 処理の流れ 評価実験 まとめ 1.音源同定とは 楽器音の同定(入力された音は,piano? flute? …) パターン認識の一分野 自動採譜?メディア検索などで有用 広く研究されるようになったのは1990年代から 1.音源同定とは 楽器音における特徴変動の要因: 音高?音の強さ?楽器の個体差?奏法など 研究事例:楽器の個体差に着目した  「適応型混合テンプレート法」(柏野他,信学論,’98) 音高による音色変化は扱われてこなかった 特に,楽器音は音声などに比べて音域が広く, 音高による音色変化が顕著 音高による音色変化を考慮した 音源同定手法を提案 2.音色空間の音高依存性を考慮した 音源同定手法 音高依存性を考慮する方法: たとえば,音域をいくつかのブロックに分割して 入力信号と同じブロックのデータで学習 細かく分割?音高依存性○,学習データ数△ 粗く分割 ?音高依存性△,学習データ数○ (学習データが少ないと性能低下の可能性) 学習データを減らさずに音高依存性を考慮するため, 基本周波数の関数をパラメータに持つ分布を提案 2.音色空間の音高依存性を考慮した音源同定手法 F0依存多次元正規分布 多次元正規分布を以下のように拡張: 平均:基本周波数の関数として定義 ?音高によって分布の平均がどのように 変化するか(音高による音色変化)を表す 共分散:上記の関数からのちらばりの程度を 表す(音高非依存) ?音高以外の要因による音色変化を表す これにより,音高による音色変化を考慮しながら, 全音域の音色パターンを1つの分布で表現可能 2.音色空間の音高依存性を考慮した音源同定手法 代表値関数 基本周波数によって変化する分布の平均を 関数近似(3次関数)により推定 2.音色空間の音高依存性を考慮した音源同定手法 代表値関数 基本周波数によって変化する分布の平均を 関数近似(3次関数)により推定 3.音色空間の音高依存性を考慮した音源同定手法 F0正規化共分散行列 代表値関数からのちらばりの程度を表す ?音高以外の要因による音色変化を表す ?音色空間を代表値関数で正規化してから, 共分散行列を求める 3.処理の流れ 特徴抽出(129個) 主成分分析で次元圧縮 (累積寄与率99%で79次元に圧縮) 線形判別分析でさらに次元圧縮 (19楽器なので18次元に圧縮) F0依存多次元正規分布のパラメータ推定 ベイズ決定規則に基づいて楽器名を同定 (事後確率が最大になる楽器名を見つける) 3.処理の流れ 特徴抽出(129個) 3.処理の流れ 特徴抽出(129個) 3.処理の流れ 特徴抽出(129個) 主成分分析で次元圧縮 (累積寄与率99%で79次元に圧縮) 線形判別分析でさらに次元圧縮 (19楽器なので18次元に圧縮) F0依存多次元正規分布のパラメータ推定 ベイズ決定規則に基づいて楽器名を同定 (事後確率が最大になる楽器名を見つける) 4.評価実験 実 験 方 法 使用データベース:RWC-MDB-I-2001 実楽器の単独発音を半音ごとに収録 今回は19種類の楽器を使用 各楽器に,3楽器個体,3種類の音の強さ 今回は,通常の奏法のみ使用 使用したデータ総数: 6247個 上記のデータを無作為に10等分し, クロスバリデーション 音高は既知 カテゴリーレベルの認識率も算出 4.評価実験 実 験 結 果 4.評価実験 実験結果/認識率が7%以上改善された楽器 4.評価実験 実験結果/カテゴリーレベルの認識率 5.ま と め 音高による音色変化を考慮するため, F0依存多次元正規分布を提案 F0依存多次元正規分布のための 識別関数をベイズ決定規則から定式化 ?音源同定の性能向上に貢献 (個々の楽器で16.48%,  カテゴリーレベルで20.67%認識誤りを削減) 今後の課題 ベイズ決定規則以外への応用 混合音への適用など * 26 Sept. 2002 x1:パワー包絡線の傾きの中央値 x2:周波数重心        など 特徴抽出 piano flute 実際には piano flute 特徴変動 ピアノ 第4軸 チェロ 第1軸 音高による音色変化を除去 例:周波数重心 ピアノ フルート 例:パワー包絡線の最小二乗法による近似直線の傾き ピアノ フルート time [ms] リコーダー ピッコロ フルート 無簧楽器 クラリネット ク

文档评论(0)

44488569 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:5101121231000003

1亿VIP精品文档

相关文档