平成18年度 中間発表会.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
平成18年度 中間発表会

July 25, 2006 平成18年度 中間発表会 HMM 音声合成の統計モデル 北村? 桜井? 平野 研究室 B4 奥村 健太 音声合成とは 機械に人間が話すような言葉を喋らせること 応用例 対話型ロボット 各種ナビゲーションシステム…など 機械と人間のコミュニケーションを円滑化 音声合成の最終的なゴール 人間が話すような自然な音声を任意に生成すること 肉声に近い音質 自然なアクセント、イントネーション、リズムの実現 音声合成の代表的手法 単位選択型 比較的自然な音声の合成が可能 膨大なデータベースが必要 音声単位間で接続歪みが発生 HMM (隠れマルコフモデル) による音声合成 多様な音声の合成が比較的容易に実現可能 イントネーションや音色の自由度が高い 音声の個人性や感情の反映が容易 合成音声に単位選択型ほどの自然性はない HMM 音声合成システム 学習部と合成部に分類 学習部 合成部 HMM 音声合成の統計モデル 従来法と提案法の差異 むすび 現在の状況 テーマの方向性についての検討 音声合成システムに親しむ 各種親しむ課題への取り組み これに関連する文献からの知識の取り込み F0 ポストフィルタの作成 基本周波数のデータにフィルタをかけ 合成音声の明瞭化を図る 今後の展望 研究についての詳細は未定 現在取り組んでいる課題の結果も加味し方向性を検討 音声合成に親しむ課題 学習文章データ数による合成音声の音質変化 HMM とは Hidden Markov Model (隠れマルコフモデル) 時系列のデータの表現に適した確率モデル 音声認識や音声合成を含む自然言語処理、映像処理などに応用 マルコフモデルの概念を拡張 マルコフモデル 観測系列から状態系列を特定可能 隠れマルコフモデル 観測系列から状態系列を特定不可能 HMMの用例 マルコフモデル 隠れマルコフモデル * * 図1: HMMからのパラメータ生成に基づく 音声合成システム 音声分析手法により 特徴パラメータを抽出 モデルを作成 学習されたモデル 合成フィルタにより 音声を合成 図2: 対角共分散と全共分散の イメージ 音声の学習 モデル パラメーター 平均ベクトル 共分散行列 ● : 従来法 対角共分散 対角線上のデータ のみ使用しそれ以外のデータは無視する ● + ● : 提案法 全共分散 全てのデータを使用 するため特徴ベクトルの次元間の相関に 損失がない 共分散行列 N次正方行列 で表される 文章数: 450 文章数: 50 「平均倍率を下げた形跡がある.」 図3: 隠れマルコフモデル (left-to-rightモデル) 好調?不調の各状態を定義した試合の勝負 0.8 0.2 S2 (不調) 0.3 0.7 S1 (好調) S2 (不調) S1 (好調) t      t+1 0.8 0.2 P2 (負) 0.3 0.7 P1 (勝) S2 (不調) S1 (好調) 図4a: マルコフモデル 表1a: 遷移確率 図4b: 隠れマルコフモデル 表1b: 出力確率 好調なら必ず勝つ 不調なら絶対勝てない 好調なら70%勝つ 不調でも30%勝てる HMMによる音声合成システムの概要を解説。 学習部と合成部に分かれている。学習は一度のみ。 学習部:音声分析手法により抽出された特徴パラメータを用いてモデルを作成 合成部:学習されたモデルを用いて合成フィルタにより音声を合成 発言内容は大体スライドそのまま。 現在一般的に用いられている手法には、単位選択型音声合成が挙げられる。 これは、基本的には録音された音声の断片を連結することにより、高品質な音声を合成する方法である。 一般に連結的合成は最も自然な合成音声になるとされており、限られた話者による読み上げ調の音声合成に限定すれば先に述べた音声合成のゴールにはかなり近づくことが可能であるが、任意の話者性や感情、発話スタイルを考慮した多様で表情豊かな音声合成の実現を考えた場合、無数に存在する個人の条件に対応する大量の音声データの収集および管理という、現実的に不可能な問題があり、このゴールはかなり遠のく。また、発声のバリエーションと波形の断片化の細かさによっては出力音声に欠損が生じ、自然さを損なうことがあるという、これもある種不可避な問題も抱えている。 それらの問題点を解決しうる方法として挙げられるのが、HMMによる音声合成である。イントネーションや音色の設定に関して自由度が高く、任意かつ多様な音声の合成が比較的容易に可能である。つまり音声データ提供者の個人性、更には発話様式が合成音声によく反映されるものであると言える。

文档评论(0)

jgx3536 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6111134150000003

1亿VIP精品文档

相关文档