- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
行列の圧縮による変化点検出の高速化-井手剛の研究紹介
行列の圧縮による変化点検出の高速化 IBM東京基礎研究所 井手 剛 変化点とは、データ生成機構にある変化が生じた時点。変化度とはその変化の度合い。 変化点検出 ≒ 知識発見 ≒ マイニング 異常検知 評判分析 etc 変化点の現れ方は多様である。 「きめ打ち」は避けたい なるべく無垢な心で変化点を捉えたい 特異スペクトル変換法(Singular Spectrum Transformation; SST)は “model-free”な変化点検出手法。「過去」と「今」のパターンを比べる。 SSTは計算が遅い! 100×100くらいのSVDを、各時刻でやる必要がある。 問題: 特異ベクトル同士のカーネル関数を、高速に計算せよ ふたつの着眼点: (1) 内積をじかに求めたい、(2) 必要な情報を事前に圧縮したい (1) 知りたいのは内積(=射影)だけだから、あらわに特異ベクトルを計算するのは無駄 特異ベクトルの計算を省略して、内積を直接求めることはできないか? (2) 必要な特異ベクトルの個数は履歴行列の次元よりはるかに小さい。フルSVDをやるのは無駄 特異値の高い特異ベクトルの成分が「濃く」なるように、行列を圧縮はできないか? の上位の固有ベクトルを濃縮するような部分空間を作ろう。 μを出発ベクトルとすることで、μと関係する成分だけを抜き出せる。 この論法を続けると、 という k 次元空間は、ρの上位の固有ベクトルの成分を最も濃く含む部分空間であることがわかる。 Implicit kernel 近似 ── 元の固有値問題が k×k の問題に帰着され、しかも内積計算が自動実行される 計算手順まとめ。2種類の特異ベクトル同士の比較は陰になされる。しかも、面倒なことすべてが、圧縮された空間内で行われる。 パラメターによっては、計算速度が100倍に。しかも目立った誤差はない。 まとめ 変化点検出は、知識発見工学の興味深い問題である。 特異スペクトル変換(SST)は、model-freeな変化点検出手法であり、多様な変化点に対応する能力がある。 しかし、とんでもなく遅い。 Implicit kernel近似という新しいアルゴリズムにより、SSTの計算速度を数10倍高速化することに成功した SSTの実用度は格段に増すことになる。 Implicit kernel近似は、SSTのみならず、固有状態への遷移確率の計算などの用途に使える汎用技術である。 Thank you. (参考) いわゆるオンラインSVDじゃだめなのか?Folding-in的仮定に基づくものは軒並み不可。 情報検索の分野では逐次更新式のSVDがよく研究されているが、変化点検出問題には不適。 仮定が成り立たない 「文書をためたDBがあまり時間変化しない」 「行列は疎な高次元行列」 代表的な手法 “folding-in”: t-1での特異ベクトルを使って、tでの特異ベクトルを表す近似的更新算法 Zha-Simon [SIAM J. Sc. Com. 1999]: いわば改良folding-in。応用例多数。 いにしえなSVD諸手法を単に使っても、速度向上には限界がある。 何らかの方法で3重対角化し、QR反復などを使うのが定番 密行列: ハウスホルダー変換 疎行列: ランチョス法 計算量的上限が決まっている。越えられない壁がある。 学習手法ごとに、適切にサボりながらPCA/SVDをやる手法は地味ながらそこそこ関心を集めている 間引く Nystr?m 法 [Williams-Seeger, NIPS 00] Channubhotla-Jepson [NIPS 04] いろいろなrandomized algorithms 圧縮する Krylov部分空間法 数学的にはいにしえだが、 KDD業界ではあまり知られていない(らしい) *| 2006/11/01 | T.Idé | IBIS 2006 Tokyo Research Laboratory ? Copyright IBM Corporation 2006 Tokyo Research Laboratory ? Copyright IBM Corporation 2006 時系列データ 変化度 各時刻ごとに移動 特徴ベクトル 特徴ベクトル 変化度 SVD SVD Moskvina Zhigljavsky 2003 Ide Inoue 2005. テスト行列 履歴行列 time 最大左特異ベクトル 両者の食い違い=変化度 SVD SVD ここが最も重い 左特異ベクトル上位 r 個
您可能关注的文档
最近下载
- 教科版三年级下册科学全册教案(表格式).docx VIP
- [2025秋期版]国开电大专科《成本会计》一平台在线形考(形考2)试题及答案.pdf VIP
- 关于医院“十五五”发展规划(2026-2030).docx VIP
- GB500182002冷弯薄壁型钢结构技术规范.pdf VIP
- 《中国福利思想重点.doc VIP
- 项目报批报建流程操作手册或项目报批报建流程指引指南.docx VIP
- LY/T 1819-2009_珍稀濒危野生植物保护小区技术规程.pdf
- 1.1互联到物联 课件 +2025—2026学年川教版(2024)初中信息科技八年级上册.pptx VIP
- 浅析县级党校干部培训工作中存在问题制约因素及改进对策.doc VIP
- 2.2.1匀变速直线运动的推论 课件 高一上学期物理人教版(2025)必修第一册(18张PPT)(含音频+视频).pptx VIP
文档评论(0)