- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于嵌入式LINUX的VoIP终端设计 英文翻译
本 科 毕 业 论 文
基于嵌入式LINUX的VoIP终端设计
文献翻 译
学院名称:计算机科学与通信工程学院
专业班级: 通信
学生姓名:
指导教师姓名:
指导教师职称: 教 授
2009 年 4 月
Chapter 5.
Performance Guidelines
5.1 Instruction Performance
To process an instruction for a warp of threads, a multiprocessor must:
‰ Read the instruction operands for each thread of the warp,
‰ Execute the instruction,
‰ Write the result for each thread of the warp.
Therefore, the effective instruction throughput depends on the nominal instruction throughput as well as the memory latency and bandwidth. It is maximized by:
‰ Minimizing the use of instructions with low throughput (see Section 5.1.1),
‰ Maximizing the use of the available memory bandwidth for each category of memory (see Section 5.1.2),
‰ Allowing the thread scheduler to overlap memory transactions with mathematical computations as much as possible, which requires that:
The program executed by the threads is of high arithmetic intensity, that is, has a high number of arithmetic operations per memory operation;
There are many threads that can be run concurrently as detailed in
Section 5.2.
5.1.1 Instruction Throughput
5.1.1.1 Arithmetic Instructions
To issue one instruction for a warp, a multiprocessor takes:
‰ 4 clock cycles for floating-point add, floating-point multiply, floating-point multiply-add, integer add, bitwise operations, compare, min, max, type conversion instruction;
‰ 16 clock cycles for reciprocal, reciprocal square root, __log(x) (see Table B-2). 32-bit integer multiplication takes 16 clock cycles, but __mul24 and __umul24 (see Appendix B) provide signed and unsigned 24-bit integer multiplication in 4 clock cycles. On future architectures however, __[u]mul24 will be slower than 32-
bit integer multiplication, so we recommend to provide two kernels, one using__[u]mul24 and the other using generic 32-bit integer multiplication, to be called appropriately by the applicatio
您可能关注的文档
- 十六课 听听那冷雨..doc
- 十六课 听听那冷雨.doc
- 十六课 声声慢.doc
- 十四课 蝶恋花.doc
- 千里之行 始于规划——网站规划.doc
- 半加器版图设计报告.doc
- 华中科技大学_液压传动课程设计说明书_完整版.docx
- 华图《申论万能宝典》总结.doc
- 华发公司小区物业管理信息系统开发 课程设计.doc
- 华阳集团薪酬管理研究 本科毕业设计.doc
- 基于嵌入式处理器的VLSI芯片的温度自动控制 外文翻译.doc
- 基于嵌入式的多路数据采集系统的设计.doc
- 基于工作与素质的人力资源管理.doc
- 基于微波传感器的智能自动门的硬件电路的深入分析与设计 课程设计(自动门).doc
- 基于数字系统的密码引爆器设计.doc
- 基于扫描隧道显微镜测定石墨中碳原子的半径.doc
- 基于数控加工中心的LOM快速成型装置数字样机设计(机械结构设计) 任务书与开题报告.doc
- 基于数控加工中心的LOM快速成型装置数字样机设计(机械结构设计) 毕业设计.doc
- 基于新农村建设的农村金融体系创新研究 毕业设计.doc
- 基于新资本协议下的我国商业银行信贷运行的问题研究 毕业论文.doc
最近下载
- 烟草考试真题及答案.doc VIP
- 2025年最新人教版八年级(初二)数学上册教学计划及进度表(新课标,新教材).docx
- 外研版高中《英语》(新标准)选择性必修一Unit1 单元整体教学设计附作业设计.docx VIP
- 5.1《论语》十二章 课件(共48张PPT)统编版高中语文选择性必修上册.pptx VIP
- 计算机网络实验报告(8)网络地址转换NAT配置、网络端口地址转换NAPT配置.pdf VIP
- 工程材料及成形技术基础-全套PPT课件.pptx
- 单证员考试试题.pdf VIP
- 地面空压机安装技术措施.docx VIP
- 工程建设法规的案例.ppt VIP
- 农产品食品检验员职业技能竞赛理论考试题库(含答案).docx VIP
文档评论(0)