- 1、本文档共51页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中央处理器指令集架构 经典指令集架构之ARM ? 应用处理器 实时处理器 微控制处理器 标识 Cortex-A Cortex-R Cortex-M 设计特点 高时钟频率,长流水线,高性能,支持媒体处理(NEON指令集扩展) 较高时钟频率,较长流水线,低延迟 低功耗,低时钟频率,较短流水线 系统特性 内存管理单元,Cache memory, ARM TrustZone安全扩展 内存保护单元,Cache memory,紧耦合内存 内存保护单元,嵌套向量中断控制器,唤醒中断控制器 目标市场 服务器、智能手机 工业微控制器、基带 微控制器,IoT, MEMS ARM架构具有一套独特的指令集系统,可以根据适用范围的不同,开发不同的处理器体系结构。经过多年的发展与积累,面向不同类型计算,ARM主要有以下几种体系结构: 中央处理器指令集架构 经典指令集架构之MIPS MIPS的意思是“无内部互锁流水级的微处理器”(Microprocessor without interlocked piped stages),其机制是尽量利用软件办法避免流水线中的数据相关问题,是一种精简指令集架构 在80年代初期由斯坦福大学John Hennessy教授团队提出 设计理念: 使用相对简单的指令集,结合高性能的编译器以及支持流水线执行指令的硬件,利用更少的资源生产出速度更快的处理器 国内的龙芯中科正在开发基于MIPS指令集架构的国产CPU。该公司拥有MIPS的永久授权,并基于MIPS架构开发了的自主指令集架构LoongArch。 中央处理器指令集架构 经典指令集架构之RISC-V RISC-V于2010年在加利福尼亚大学伯克利分校实验室项目中启动,该项目需要一种简单,高效,可扩展且对与他人共享没有限制的指令集架构 2016年,RISC-V基金会正式成立 中央处理器指令集架构 经典指令集架构之RISC-V RISC-V指令集的优势 开源 后发 优势 简洁 模块 化 稳定 中央处理器的发展趋势 芯片上的晶体管数量仍随着时间呈指数增长 随着摩尔定律逐渐接近物理极限时,半导体行业提出了使用高级封装配合异构计算的方法来继续提升芯片系统性能。 3D IC SoC Chiplet 数字集成电路基础 数字集成电路设计方法 中央处理器 图形处理器 类脑计算芯片 片上系统 目录 图形处理器 图形处理器(Graphics Processing Unit, GPU):指专用的图形加速电路和可编程图形加速芯片的统一。 GPU在计算机领域里通常是独立芯片产品,或者是以电路模块的形式集成在CPU的内部 移动设备产品上,GPU往往以IP核的形式集成在SoC内部 当今GPU芯片已从原来的图形加速专用芯片发展为大规模并行处理(Massively Parallel Processing , MPP)的系统级芯片 包含GPU的NVIDIA Xavier芯片 GPU工作流程 顶点处理 根据图形程序接口指令处理三维模型顶点的变换、光照运算,利用顶点着色器完成 三角形设置/剪切 将三维模型的顶点按视角映射到二维显示平面,将多边形分解为多个三角形的组合,并除去多余部分 光栅化计算 利用光栅生成器将前一步保留的三角形由矢量图形转换为一系列像素点的过程就称为光栅化 纹理帖图 利用像素着色器对点阵图像的像素进行逐一处理,顶点单元生成的多边形只可以形成三维物体的一个轮廓,而纹理映射过程则会对多变形表面进行帖图 像素处理 在对每个像素进行光栅化处理时,GPU会完成对单个像素的处理和计算工作,进一步完成属性的最终确定,然后合成为完整的图像并予以显示 CPU和GPU的构成区别 黄色显示的是控制器(Control)、绿色的部分是算术逻辑单元(ALU)、橙色部分是缓存(Cache)和由DRAM构成的内存。GPU的执行单元面积更大,其控制电路也较为简单,对缓存的需求较小,大部分开销都在计算单元。CPU需要同时照顾指令的并行执行和数据的并行运算,控制电路较为复杂,需要较多的控制单元和缓存。 GPU编程库 NVIDIA – CUDA:可以使用C语言等高级编程语言来为CUDA架构编写程序,还可以基于Java语言库,通过JNI书写程序并转化成C语言。 苹果 – OpenCL:通用标准编程库 GPU介绍 GPU应用实例——NVIDIA A100 Tensor Core GPU 数字集成电路基础 数字集成电路设计方法 中央处理器 图形处理器 类脑计算芯片 片上系统 目录 存储墙和功耗墙问题 (a) 基于20nm片上存储的64位的浮点数运算与DRAM、SRAM数据搬运功耗的数据;(b) 执行数据运算的能量随着制程尺寸变化的示意图 类脑计算芯片分类 现有的深度学习网络类型及计算量 数字集成电路基础 数字集成电路设计方法 中央处理
文档评论(0)