分散メモリ型スパースソルバの开发と评似 - 计算基盘研究室.ppt

分散メモリ型スパースソルバの开发と评似 - 计算基盘研究室.ppt

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
分散メモリ型スパースソルバの开发と评似 - 计算基盘研究室

応用数理工学特論 線形計算と ハイパフォーマンスコンピューティング 第8回 名古屋大学 計算理工学専攻 山本有作 1. はじめに 本研究で対象とする問題 標準固有値問題 Ax = lx A : n×n 非対称密行列 応用分野 MHD 化学工学 量子化学 流体力学 Cf. Bai and Demmel: A test matrix collection for non-Hermitian eigenvalue problems. 非対称行列の固有値計算の流れ 各部分の実行時間 全固有値を求める場合の演算量 ヘッセンベルグ 化: (10/3) n3 QR法:  10n3 (経験値) 演算量(時間)の大部分をQR法が占める。 QR法の高速化が必要 QR法の特徴と高性能計算 QR法の基礎 アルゴリズム(Francis, 1961 Kublanovskaya, 1961) 行列 A0 から始めて次のように QR 分解と相似変換を繰り返す。 A0 = Q1R1 A1 = R1Q1 (= Q1–1A0 Q1 ) A1 = Q2R2 A2 = R2Q2 (= Q2–1A1 Q2 = Q2–1Q1–1A0 Q1Q2 ) 収束定理 適当な条件の下で,Ak は(ブロック)上三角行列に収束 A0 の固有値を絶対値の大きい順に l1, l2, … , ln とすると,対角要素 aij は li に1次収束 非対角要素 aij (j i)は収束率 rij ≡ |li| / |lj| で 0 に1次収束 ダブルシフトQR法 シフトの導入 Ak から固有値 li の近似値 s を引いた行列に対して QR 法を適用 Ak – s I = Qk Rk Ak+1 = Rk Qk + s I (= Qk–1Ak Qk )         rij ≡ |li – s| / |lj – s| ≒ 0 より収束が加速 ダブルシフトQR法 共役複素数の固有値ペアに対し,シフト s, s による2反復をまとめて行う (Ak – s I)(Ak – s I) = Qk Rk Ak+2 = Qk–1Ak Qk シフトは右下隅の 2×2 行列の固有値に取る     → 局所的に2次収束 複素数の固有値を持つ場合でも,実数演算だけで QR 法を実行可能 Hessenberg 形と Implicit Q 定理 Hessenberg 形の利用 Ak が Hessenberg 形のとき, QR法の1ステップは O(n2) で実行可能 Ak+1 も Hessenberg 形 Implicit Q 定理の利用により,QR 分解を陽に行う   ことなく1ステップの計算を実行可能      A0 を Hessenberg 形に相似変換してからQR法を適用 Implicit Q 定理 U,V が直交行列で,G = UtAU, H = VtAV が共に既約な Hessenberg 行列であるとする。 このとき,もし U と V の第1列が等しいならば,±1 を要素に持つ対角行列 D が存在して,V = UD,H = DGD が成り立つ すなわち,行列 A を既約な Hessenberg 行列に相似変換する直交行列は,第1列目だけが与えられれば(実質的に)一意に定まる Implicit shift QR法 1ステップの計算 (Ak – s2I)(Ak – s1I) の第1列を e1の定数倍にするハウスホル   ダー変換H0 を求める Ak’ = H0tAk H0 直交行列による相似変換を繰り返すことにより, Ak’ を再び   Hessenberg 行列に変形する(bulge-chasing) この変換の性質 ある直交行列 H による相似変換 H の第1列は,Qk の第1列に等しい 上記第3のステップは第2行?第2列以降のみに影響 H は Ak を Hessenberg 形に変換 Implicit Q 定理より,Ak+1 = H tAk H はQR法の1ステップと等価 陰的ダブルシフトQR法の演算パターン バルジ追跡における演算 3×3のハウスホルダー変換を左右からかけることにより,bulge を1つ右下に動かす 演算の特徴 並列粒度は O(n) 並列アルゴリズム: R. Suda et al.(1999),G. Henry et al. (2002) QR法の1ステップで,各行列要素は3回のみ更新   データ再利用性が低く,キャッシュの有効利用が困難 2. マルチシフトQR法 原理 (Bai Demmel, 1989) Ak の右下の m×m 行列の固有値 s1,s2 , … , sm をシフトとして用い,QR法の m ステップを

文档评论(0)

wujianz + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档