武汉大学第1学期多核架构及编程技术试卷A.doc

下载文档 降价啦

16
0
约2.99千字
约 4页
2018-06-06 发布于天津
举报
版权申诉
保障服务

武汉大学第1学期多核架构及编程技术试卷A.doc

1、本文档共4页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

武汉大学第1学期多核架构及编程技术试卷A

武汉大学2008—2009学年度第1学期《多核架构及编程技术》试卷（A）答案简答题（共30分，每题10分）什么是线程、进程，它们之间的关系是什么？答：进程是一组离散的(执行)程序任务集合；线程是进程上下文中执行的代码序列，又被称为轻量级进程。进程中可包含一个或多个线程。 2．由于线程共享同一进程的内存空间，多个线程可能需要同时访问同一个数据，如果没有正确的保护措施，对共享数据的访问会造成数据的不一致和错误。简述Windows环境下常用的全局变量、事件和临界区三种同步机制。答：进程中的所有线程均可以访问所有的全局变量，各线程根据全局变量的状态来决定是否运行相应的线程函数，它是Win32多线程同步的最简单方式。事件是WIN32提供的最灵活的线程间同步方式，各线程根据事件的激发状态来决定是否运行相应的线程函数。临界区是一种防止多个线程同时执行一个特定代码段的机制，适用于多个线程操作之间没有先后顺序但要求互斥的同步。多个线程访问同一个临界区的原则：一次最多只能一个线程停留在临界区内；不能让一个线程无限地停留在临界区内，否则其他线程将不能进入该临界区。请分别说明OpenMP指导语句#pragma omp parallel, #pragma omp parallel for 和#pragma omp parallel private 的含义和作用。答：#pragma omp parallel 区域并行性指导语句，说明后续语句按多线程方式运行； #pragma omp parallel for 循环并行化指导语句，说明后续for循环语句按多线程方式运行； #pragma omp parallel private并行区变量私有化指导语句，说明后续语句中的某变量在多线程方式运行时被各线程私有化，每次仅容许一个线程访问该变量。程序修改题（共30分，每题10分）已知某串行程序如下，请利用OpenMP的指导语句将其变为并行程序。（要求写出完整的并行程序）答：并行程序如下： #include stdafx.h void main () { int i; double x, sum=0； for (i=0;i 1000; i++) { x = i*0.5; sum += x; } } 已知某多线程程序如下，请指出该程序线程同步冲突的地方，并改正。（要求写出完整的改正后程序）答：改正后的程序如下： #include stdafx.h #include omp.h void main () { int i; double sum=0； for (i=0;i 1000; i++) #pragma omp atomic sum ++; } 已知某IPP信号处理程序如下，请指出该程序的作用，并添加对信号处理过程的时钟计数功能语句，以统计信号处理过程所需的时钟总数。（要求写出完整的修改后程序）答：该程序实现二个相位差为π的三角波的卷积。修改后的程序如下: #include stdafx.h #include ipp.h int main(int argc, char* argv[]) { const int len1 = 64, len2 = 64; Ipp64u start, end; Ipp16s* pSrc1 = ippsMalloc_16s(len1); Ipp16s* pSrc2 = ippsMalloc_16s(len2); Ipp16s* pDst = ippsMalloc_16s(len1+len2-1); float phase=3.141592654f; ippsTriangle_Direct_16s(pSrc1, len1, 256.0f, 2.0/len1, 0.0f, phase); ippsAddC_16s_I(256, pSrc1, len1); phase=0.0; ippsTriangle_Direct_16s(pSrc2, len2, 256.0f, 2.0/len2, 0.0f, phase); ippsAddC_16s_I(256, pSrc2, len2); start=ippGetCpuClocks(); ippsConv_16s_Sfs(pSrc1, len1, pSrc2, len2, pDst, 8); end=ippGetCpuClocks(); printf(“Clocks for convolution is %d”, (end-start)); ippsFree(pSrc1); ippsFr