筑波大学大学院インテル特别讲义.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
筑波大学大学院インテル特别讲义

筑波大学大学院インテル特別講義 レポート 筑波大学システム情報工学研究科 コンピュータサイエンス専攻 XXXX 学籍番号 XXXX 課題1 Cプログラム(lap.c)の最適化作業 lap.cで示すプログラムをIntel Xeon E5-2699V3を2個用いたサーバ上で実行し,最適化したい。この時に行う作業についてレポートにまとめてください。 4、最適化の対象と方法 関数main: 二次元配列を初期化するループ。アルゴリズム起動時間に影響がある。最適化方法は並列化。 関数lap_main: 二次元配列をコピー、そして二つの配列を用いて計算する二つのループ。最適化方法はベクトル化と並列化。 関数verify: 二つの二次元配列に含めるすべて数値の差の総和を計算する。最適化方法は並列化。 5、最適化対象プログラムと最適化プランの問題点 このプログラムは、グローバル静的二次元配列でダブル精度浮動小数点数を記録する。今の段階10000x10000ではスタックのスペースは足りるが、規模を拡大したいと足りなくなる。malloc()で、アライメントを考えてから書き直すことが考えられる。 lap_mainの中の二つの子ループは、一回実行される操作の量が少ないので、自動並列化に不向きである。要するには、できるだけ二つの子ループを統合することである。 最適化プランの最後に、並行化に特化したフレームワークでプログラムを書き直すことを決定した。なぜこの手順を行うのは、Cコンパイラの最適化には限界がある、そして手動でコンパイラの最適化結果より速いアセンブラコードを書くのは容易ではないためである。 課題1の解答は以上である。 課題2 インテル社のCPUと他社製品の比較 1、最強デスクトップ向CPUの対決 ご存知のように、現在x86-64のデスクトップ向けCPU市場には、二つ会社の製品に分けられた。IntelとAMD系のデスクトップCPUは、1998年のPentium II vs K6-2から、ほかの会社が参入できないほど激しい性能と市場シェアの競争が続いている。ここでは現時点(2015年6月8日) 製品名 Intel Core i7-5960X AMD FX-9590 マイクロアーキテクチャ Haswell Piledriver 製造プロセス Intel 22nm 3D Tri-Gate SOI HKMG 32nm ソケット LGA 2011-v3 Socket-AM3+ コア数(スレッド数) 8(16) 8(8) 定格クロック 3.0 GHz 4.7 GHz 最大ターボクロック 3.5 GHz 5.0 GHz バススピード QPI、6.4GT/s HyperTransport、2.4GHz L1キャッシュ 64 KB x 8 384 KB L2キャッシュ 256 KB x 8 2 MB x 4 L3キャッシュ 20 MB 8 MB 命令セット x86,x87,x86-64,MMX SSE,SSE2,SSE3,SSE4 AVX,AVX2,FMA,AES-NI,VT-x x86,x87,x86-64,MMX, SSE,SSE2,SSE3,SSE4 AVX,FMA,AES,AMD-V GPUコア なし なし メモリサポート DDR4-2133 DDR3-2133 TDP 140?W 220 W 発売日 2014年8月29日 2013年7月6日 価格(ドル) $1000 $269 表1最強デスクトップCPUの仕様比較 二つのCPUを比べば、Core i7-5960xがの優れるポイントは以下である。 1)自社工場で自社の優れている製造プログレスで製造される。Intelは、ほかの半導体製造者(TSMC、GlobalFoundries、サムソン)などより、常に優位性を保っている。例えばIntelが14nmのプロセスで量産化できたCore Mを出荷した2014年9月のところ、ほかの半導体製造者はまた14nmを量産し始まっていない。2015年3月にようやくサムソンが最初のIntel以外に14nmプロセッサ(Samsung Exonos 7420)を出荷した。製造プロセスの優位性があるため、他社より高い基本性能と低い電力消費ができるだろう。 2)ベクター命令セットが多い。i7-5960xはAVX2をサポートしているが、FX-9590はまだサポートしていない。 3)コア数が同じ、クロック周波数が低いのに、ベンチマークテストに最終的に性能がi7-5960xの方が良い。AnandTechのテストによると、各ベンチマーク項目で、マルチスレッドであろうかシングルスレッドであろうか、i7-5960xの方は成績が高い。Intelのマイクロアーキテクチャ

文档评论(0)

ctuorn0371 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档