- 1、本文档共39页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
計算機構成: トップダウンの解説 - amano lab
コンピュータアーキテクチャ:ここでやったことこれからやること 計算機構成同演習最終回 天野 コンピュータの構成 記憶の階層 重要な入出力(I/O) バスブリッジを介してI/Oバスと接続 メモリと同様な番地付けをする場合が多い (Memory-mapped I/O) マルチメディア化により範囲が広がる ディスク、テープ、CD、DVDなどの補助記憶 Ethernetなどのネットワーク ビットマップディスプレイ、CDCビデオ入力 キーボード、マウス等の入力装置 音声出力、入力 メモリシステムと入出力 関連した実験 入出力実験用ボード CPUの構成(この授業でやった部分) マイクロプロセッサの性能向上VAX-11/780を1とした時 CPU性能向上のための技法 パイプライン処理 スーパスカラ方式 VLIW(Very Long Instruction Word)方式 最近のマイクロプロセッサ 半導体技術の進展 面積は大きくなる しかし、性能はさほど向上しなくなる 0.1μm以降:スケーリング則の崩壊 スーパスカラプロセッサの複雑化 →設計コストの増大、性能向上の頭打ち 面積に見合った性能をいかに得るか? 拡張されたVLIW方式 SMT (Simultaneous Multi?Threading) マルチプロセッサ化 Reconfigurable Systems Intel Itanium 64bit用命令セットIA-64に対応 VLIWの考え方を導入 コンパイラ主導による複数命令同時発行 動的スケジューリングを行わない しかし、単純なVLIWではなく柔軟性が高い一方、構造はかなり複雑 投機的実行を支援 ループ処理向けの様々な機能を持つ 柔軟なVLIW(命令のグループ化) 柔軟なVLIW(グループとバンドル) パイプライン構成 Block Diagram Simultaneous Multithreading (SMT) スーパスカラプロセッサ 複数命令同時発行 マルチスレッドプロセッサ コンテキストスイッチをハードウェアでサポート SMTは両方の特徴を継承 プロセッサの利用効率が向上 SMTの動作 スーパスカラとの比較 SMTの利点 並列度をスレッドレベルから命令レベルへ IPC の向上 レイテンシの隠蔽が可能 OS(kernel)の影響が減少 コンテキストスイッチをハードウェアで実行 ユニプロセッサと並列計算機の境目 どのようなレベルの並列性を利用するか? ILP(Instruction Level Parallelism) 命令レベルの並列処理 Trace Level Parallelism 数命令から成る命令列 Thread Level Parallelism 一定の大きさの命令列(複数プロセス) Process Level Parallelism プログラマ、コンパイラが分割した一定の処理を行う命令列 同時発行数の増加vs. プロセッサを接続 Flynnの分類 命令流(Instruction Stream)の数: M(Multiple)/S(Single) データ流(Data Stream)の数:M/S SISD ユニプロセッサ(スーパスカラ、VLIWも入る) MISD:存在しない(Analog Computer) SIMD MIMD SIMD SIMD型の分類 粗粒度型:各ノードで浮動小数点演算処理が可能 ILLIAC-IV,BSP,GF-11 最近の高性能CPUのマルチメディア命令 細粒度型:各ノードは1bitまたは数bitの演算しかできない ICL DAP, CM-2,MP-2 コネクションマシンは応用分野を人工知能に拡大(CmLispの功績) MIMD MIMD型並列計算機 SMP:Symmetric Multi-Processor 2-4プロセッサの小規模なマルチプロセッサでサーバ用に普及 オンチップマルチプロセッサ:最近、各社で実用化される PCクラスタ:手軽に高性能化が実現可能 大規模並列計算機:数は減ったがグリッドによってどこでも利用になりつつある。 Power4(IBM) 0.18μm copper process, 400m㎡ 17000M Tr. Inter-chip interface for MCM(Multi-Chip Module) TLP(Thread Level Parallelism) Design considering memory bandwidth Shared cache + links Power4(IBM) PCクラスタ 汎用のPCを構成要素として利用 通常のLANを用いたべオルフ型 MyrinetなどのSANを用いた高性能指向 安価で高性能 PCと
您可能关注的文档
- 会计人员操作手册_36413.doc
- 绘本教学课方案设计.doc
- 会声会影9.0使用教程 - 广西师范大学教育学部.ppt
- 惠州市第十四届优秀科学学术论文申报汇总.doc
- 绘画的种类.ppt
- 汇率制度文稿.doc
- 会爱的小獅子文稿.ppt
- 会声会影操作教学文稿.ppt
- 基本word操作说明.ppt
- 基层妇幼卫生信息ppt.ppt
- 全国青少年(毒品预防教育)知识考试题库与答案 .pdf
- 2023年山东胶州市领军计划自主招生历史试题真题(含答案详解) .pdf
- 【人教版八年级生物】第六单元 第二章 认识生物的多样性 .pdf
- 冀人版-第三单元 电(提升卷)-四年级科学上册单元培优进阶练.docx
- 新郑市事业单位统考真题 .pdf
- 冀人版-第三单元动物的生长与繁殖(单元测试)四年级下册科学.docx
- CLCN4基因变异相关癫痫的临床表型及基因变异特点 .pdf
- 【《“双减”背景下小学中年级语文自主阅读策略探究》6500字】 .pdf
- 高一语文开学第一课+课件+2024-2025学年统编版高中语文必修上册 .pdf
- 密山市事业单位统考真题 .pdf
文档评论(0)