- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
武汉大学2008—2009学年度第1学期《多核架构及编程-IntelSoftware.doc
PAGE
PAGE 4
武汉大学2008—2009学年度第1学期
《多核架构及编程技术》试卷(A)答案
简答题(共30分,每题10分)
什么是线程、进程,它们之间的关系是什么?
答:进程是一组离散的(执行)程序任务集合;线程是进程上下文中执行的代码序列,又被称为轻量级进程。进程中可包含一个或多个线程。
2.由于线程共享同一进程的内存空间,多个线程可能需要同时访问同一个数据,如果没有正确的保护措施,对共享数据的访问会造成数据的不一致和错误。简述Windows环境下常用的全局变量、事件和临界区三种同步机制。
答:进程中的所有线程均可以访问所有的全局变量,各线程根据全局变量的状态来决定是否运行相应的线程函数,它是Win32多线程同步的最简单方式。
事件是WIN32提供的最灵活的线程间同步方式,各线程根据事件的激发状态来决定是否运行相应的线程函数。
临界区是一种防止多个线程同时执行一个特定代码段的机制,适用于多个线程操作之间没有先后顺序但要求互斥的同步。多个线程访问同一个临界区的原则:
一次最多只能一个线程停留在临界区内;
不能让一个线程无限地停留在临界区内,否则其他线程将不能进入该临界区。
请分别说明OpenMP指导语句#pragma omp parallel, #pragma omp parallel for 和#pragma omp parallel private 的含义和作用。
答:#pragma omp parallel 区域并行性指导语句,说明后续语句按多线程方式运行;
#pragma omp parallel for 循环并行化指导语句,说明后续for循环语句按多线程方式运行;
#pragma omp parallel private并行区变量私有化指导语句,说明后续语句中的某变量在多线程方式运行时被各线程私有化,每次仅容许一个线程访问该变量。
程序修改题(共30分,每题10分)
已知某串行程序如下,请利用OpenMP的指导语句将其变为并行程序。(要求写出完整的并行程序)
答:并行程序如下:
#include stdafx.h
void main ()
{ int i; double x, sum=0;
#pragma omp parallel for private(x) reduction(+,sum) for (i=0;i 1000; i++)
{ x = i*0.5; sum += x; } }
已知某多线程程序如下,请指出该程序线程同步冲突的地方,并改正。??要求写出完整的改正后程序)
答:改正后的程序如下:
#include stdafx.h
#include omp.h
void main ()
{ int i; double sum=0;
for (i=0;i 1000; i++)
#pragma omp atomic
sum ++; }
已知某IPP信号处理程序如下,请指出该程序的作用,并添加对信号处理过程的时钟计数功能语句,以统计信号处理过程所需的时钟总数。(要求写出完整的修改后程序)
答:该程序实现二个相位差为π的三角波的卷积。修改后的程序如下:
#include stdafx.h
#include ipp.h
int main(int argc, char* argv[])
{
const int len1 = 64, len2 = 64;
Ipp64u start, end;
Ipp16s* pSrc1 = ippsMalloc_16s(len1);
Ipp16s* pSrc2 = ippsMalloc_16s(len2);
Ipp16s* pDst = ippsMalloc_16s(len1+len2-1);
float phase=3.141592654f;
ippsTriangle_Direct_16s(pSrc1, len1, 256.0f, 2.0/len1, 0.0f, phase);
ippsAddC_16s_I(256, pSrc1, len1);
phase=0.0;
ippsTriangle_Direct_16s(pSrc2, len2, 256.0f, 2.0/len2, 0.0f, phase);
ippsAddC_16s_I(256, pSrc2, len2);
start=ippGetCpuClocks();
ippsConv_16s_Sfs(pSrc1, len1, pSrc2, len2, pDst, 8);
end=ippGetCpuClocks();
prin
文档评论(0)