武汉大学2008—2009学年度第1学期《多核架构及编程-IntelSoftware.doc

武汉大学2008—2009学年度第1学期《多核架构及编程-IntelSoftware.doc

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
武汉大学2008—2009学年度第1学期《多核架构及编程-IntelSoftware.doc

PAGE  PAGE 4 武汉大学2008—2009学年度第1学期 《多核架构及编程技术》试卷(A)答案 简答题(共30分,每题10分) 什么是线程、进程,它们之间的关系是什么? 答:进程是一组离散的(执行)程序任务集合;线程是进程上下文中执行的代码序列,又被称为轻量级进程。进程中可包含一个或多个线程。 2.由于线程共享同一进程的内存空间,多个线程可能需要同时访问同一个数据,如果没有正确的保护措施,对共享数据的访问会造成数据的不一致和错误。简述Windows环境下常用的全局变量、事件和临界区三种同步机制。 答:进程中的所有线程均可以访问所有的全局变量,各线程根据全局变量的状态来决定是否运行相应的线程函数,它是Win32多线程同步的最简单方式。 事件是WIN32提供的最灵活的线程间同步方式,各线程根据事件的激发状态来决定是否运行相应的线程函数。 临界区是一种防止多个线程同时执行一个特定代码段的机制,适用于多个线程操作之间没有先后顺序但要求互斥的同步。多个线程访问同一个临界区的原则: 一次最多只能一个线程停留在临界区内; 不能让一个线程无限地停留在临界区内,否则其他线程将不能进入该临界区。 请分别说明OpenMP指导语句#pragma omp parallel, #pragma omp parallel for 和#pragma omp parallel private 的含义和作用。 答:#pragma omp parallel 区域并行性指导语句,说明后续语句按多线程方式运行; #pragma omp parallel for 循环并行化指导语句,说明后续for循环语句按多线程方式运行; #pragma omp parallel private并行区变量私有化指导语句,说明后续语句中的某变量在多线程方式运行时被各线程私有化,每次仅容许一个线程访问该变量。 程序修改题(共30分,每题10分) 已知某串行程序如下,请利用OpenMP的指导语句将其变为并行程序。(要求写出完整的并行程序) 答:并行程序如下: #include stdafx.h void main () { int i; double x, sum=0; #pragma omp parallel for private(x) reduction(+,sum) for (i=0;i 1000; i++) { x = i*0.5; sum += x; } } 已知某多线程程序如下,请指出该程序线程同步冲突的地方,并改正。??要求写出完整的改正后程序) 答:改正后的程序如下: #include stdafx.h #include omp.h void main () { int i; double sum=0; for (i=0;i 1000; i++) #pragma omp atomic sum ++; } 已知某IPP信号处理程序如下,请指出该程序的作用,并添加对信号处理过程的时钟计数功能语句,以统计信号处理过程所需的时钟总数。(要求写出完整的修改后程序) 答:该程序实现二个相位差为π的三角波的卷积。修改后的程序如下: #include stdafx.h #include ipp.h int main(int argc, char* argv[]) { const int len1 = 64, len2 = 64; Ipp64u start, end; Ipp16s* pSrc1 = ippsMalloc_16s(len1); Ipp16s* pSrc2 = ippsMalloc_16s(len2); Ipp16s* pDst = ippsMalloc_16s(len1+len2-1); float phase=3.141592654f; ippsTriangle_Direct_16s(pSrc1, len1, 256.0f, 2.0/len1, 0.0f, phase); ippsAddC_16s_I(256, pSrc1, len1); phase=0.0; ippsTriangle_Direct_16s(pSrc2, len2, 256.0f, 2.0/len2, 0.0f, phase); ippsAddC_16s_I(256, pSrc2, len2); start=ippGetCpuClocks(); ippsConv_16s_Sfs(pSrc1, len1, pSrc2, len2, pDst, 8); end=ippGetCpuClocks(); prin

文档评论(0)

170****0532 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8015033021000003

1亿VIP精品文档

相关文档