现在的位置: 首页 > 综合 > 正文

OPENMP小记

2013年12月04日 ⁄ 综合 ⁄ 共 2471字 ⁄ 字号 评论关闭

转自:http://ybmmwjl.blog.163.com/blog/static/6563878120102612019166/ 

配置及简介

1.1 VC++2008VC9.0)中,如果没有任何设置,在代码中使用编译指导语句将不会报错,但是也不起作用。

 

1.2 OpenMP发展与优势

(部分摘自:http://blog.chinaunix.net/u2/86537/showart_1960650.html

1.2.1 OpemMP的规范由SGI发起,它是一种面向共享内存以及分布式共享内存的多处理器多线程并行编程语言OpenMP是一种共享内存并行的应用程序编程接口。所有的处理器都被连接到一个共享的内存单元上,处理器在访问内存的时候使用的是相同的内存编址空间。由于内存是共享的,因此,某一处理器写入的数据会立刻被其他处理器访问到。

    OpenMP具有良好的可移植性,支持FortranC/C++编程语言,操作系统平台方面则支持UNIX系统以及Windows系统。OpenMP的重要性在于,它能够为编写多线程程序提供一种简单的方法,而无需程序员进行复杂的线程创建、同步、负载平衡和销毁工作。

1.2.2 OpemMP的变成模型以线程为基础,通过编译指导语句来显示地并行化,为编程人员提供了对并行化的完整的控制。在并行执行的时候,主线程和派生线程共同工作。在并行代码结束执行后,派生线程退出或者挂起,不再工作,控制流回到单独的主线程中。

OpenMP的功能由两种形式提供,编译指导语句和运行时库函数。

1)编译指导语句

编译指导语句的含义是在编译器编译程序的时候,会识别特定的注释,而这些特定的注释就包含这OpenMP的程序的一些语义。例如在C/C++程序中,用#pragma omp parallel来标志一段并行程序块。在一个无法识别OpenMP语义的编译器中,会将这些特定的注释当做普通的程序注释而被忽略。因此,仅使用编译指导语句编写的OpenMP程序就能够同时被普通编译器和支持OpenMp的编译器处理。这种性质带来的好处就是用户可以使用同一份代码来编写串行和并行的程序,或者在把串行程序改编成并行程序的时候,保持串行源代码部分不变,从而极大地方便了程序编写人员。

编译指导语句的形式为:

#pragam omp <directive> [clause[[,] clause]. . .]

其中directive部分就包含了具体的编译指导语句,包括parallel, for, parallel for, section, sections, single, master, critical, flush, orderedatomic。这些编译指导语句或者用来分配任务,或者用来同步。后面可选的子句clause给出了相应的编译指导语句的参数,子句可以影响到编译指导语句的具体行为,每一个编译指导语句都有一系列适合它的子句。其中parallelforsectionssection等主要用来创建线程。

2)运行时库函数

另外一种提供OpenMP功能的形式就是OpenMP的运行时库函数,它用于设置和获取执行环境的相关信息,它们当中也包含一系列用以同步的API。要使用运行时库函数所包含的库函数,必须在相应的源文件中包含头文件omp.hOpenMP库函数类似于相应编程语言内部的函数调用,因此在没有库支持的编译器上就无法正确识别OpenMP程序,这是库函数与编译指导语句不同的地方。

编译指导语句的优势体现在编译阶段,对于运行阶段则支持较少。OpenMP提供了运行时库函数来支持运行时对并行环境的改编和优化,但这种方式打破了源代码在串行和并行之间的一致性。

1.2.3 IDE

Microsoft Visual Studio20052008都完全支持OpenMP编程。安装之后,无需另外其他的软件,通过新的编译器选项/openmp来支持OpenMP程序的变异和连接,编译器会自动地将用户的代码和OpenMPwindows下实现库vcomp.dll链接在一起。程序在运行的时候会自动地寻找vcomp.dll

1.3 OpenMP多线程应用程序性能分析

影响性能的主要因素有:

1OpenMP本身的开销

    OpenMP获得应用程序多线程并行化的能力不是凭空而来的,它需要程序库的支持,库中代码的运行必然会带来一定的开销。实际上并不是所有的代码都需要并行化,有些代码在并行化后的执行效率反而不如串行时高,原因就是加上了并行化所带来的开销后,代码的执行效率降低。因此,只有在并行执行代码负担足够大,而引入OpenMP本身的开销又足够小时,引入并行化操作才能提高程序执行效率。

2)负载均衡

    已知一个OpenMP应用程序在执行的过程中,有很多的同步点,线程只有在进行同步之后才能继续执行下面的代码。因此某一个线程在执行到同步点之后,若没有进一步的工作需要完成,此线程只有等待其它线程执行完毕后才能继续执行。此时,如果各个线程之间的负载不均衡,就有可能出现某些线程空等,而另外一些线程因负担沉重,要很长事件才能完成任务。

3 线程同步带来的开销

    线程之间存在同步开销是多线程应用程序的特点,在进行同步时候必然会带来一定的开销。很多情况下,不合适的同步机制或算法会使代码的运行效率下降。

 

1.4 多核编程的几个难题及其应对策略

(摘自:http://soft.zdnet.com.cn/software_zone/2007/0418/387568.shtml

1)加速系数:衡量多处理器系统的性能是,通常要用到的一个指标叫做加速系数,定义如下:

S(p) = 使用单处理器执行时间(最好的顺序算法) / 使用具有p各处理器所需执行的时间

2)阿姆达尔定律(Amdahl)
S(p) = p / (1 + (p – 1) * f)

其中S(p)表示加速系数,p表示处理器个数,f表示串行部分所占整个程序执行时间的比例。

f = 5%, p = 20, S(p) = 10.256左右
f = 5%, p = 100, S(p) = 16.8左右

也就是说只要串行部分

抱歉!评论已关闭.