c++ - 配列 - openmp 関数呼び出し




OpenMPでの配列の削減 (2)

OpenMPの縮小操作で配列を使用できるFortranにコードを変換すると、魅力的ではありませんが、一時変数の束を使用することができます。 例えば

int S0, S1, S2, ..., S9;
...
#pragma omp parallel for private(...) shared(S0, S1, S2, ..., S9) \
            reduction(+:S0, S1, S2, ..., S9)
for ...

これにより、一時的なもののどれを更新するかを決定するための何らかのif文またはcase文を書く必要があるという魅力的でない見通しが残されます。 あなたのコードが単なる学習のための例であれば、続けてください。

しかし、あなたの意図が本当にパラレルプレフィックス和ルーチンを書いていれば、それから周りを検索します。 これは始めるのに適した場所です。

次のプログラムを並列化しようとしていますが、配列を減らす方法はわかりません。 私はそうすることができないことを知っていますが、代替手段がありますか? ありがとう。 (私は間違っているmの削減を追加しましたが、それを行う方法についてアドバイスをしたいと思います。)

#include <iostream>
#include <stdio.h>
#include <time.h>
#include <omp.h>
using namespace std;

int main ()
{
  int A [] = {84, 30, 95, 94, 36, 73, 52, 23, 2, 13};
  int S [10];

  time_t start_time = time(NULL);
  #pragma omp parallel for private(m) reduction(+:m)
  for (int n=0 ; n<10 ; ++n ){
    for (int m=0; m<=n; ++m){
      S[n] += A[m];
    }
  }
  time_t end_time = time(NULL);
  cout << end_time-start_time;

  return 0;
}

はい、OpenMPで配列を減らすことは可能です。 Fortranでは、これにも構造があります。 C / C ++では、自分で行う必要があります。 それを行うには2つの方法があります。

最初の方法は、各スレッドに対してSプライベートバージョンを作成し、それらを並行して埋め込み、クリティカルセクションのSにマージします(以下のコードを参照)。 2番目の方法は、次元10 * nthreadsの配列を作成します。 この配列を並列に埋め込み、クリティカルセクションを使用せずにSマージします。 2番目の方法ははるかに複雑で、特に注意しないとマルチソケットシステムでキャッシュの問題が発生する可能性があります。 詳細はこちらを参照してください。 クリティカルセクションを使用せずにOpenMPと並行してフィルヒストグラム(配列の削減)を行う

第1の方法

int A [] = {84, 30, 95, 94, 36, 73, 52, 23, 2, 13};
int S [10] = {0};
#pragma omp parallel
{
    int S_private[10] = {0};
    #pragma omp for
    for (int n=0 ; n<10 ; ++n ) {
        for (int m=0; m<=n; ++m){
            S_private[n] += A[m];
        }
    }
    #pragma omp critical
    {
        for(int n=0; n<10; ++n) {
            S[n] += S_private[n];
        }
    }
}

第2の方法

int A [] = {84, 30, 95, 94, 36, 73, 52, 23, 2, 13};
int S [10] = {0};
int *S_private;
#pragma omp parallel
{
    const int nthreads = omp_get_num_threads();
    const int ithread = omp_get_thread_num();

    #pragma omp single 
    {
        S_private = new int[10*nthreads];
        for(int i=0; i<(10*nthreads); i++) S_private[i] = 0;
    }
    #pragma omp for
    for (int n=0 ; n<10 ; ++n )
    {
        for (int m=0; m<=n; ++m){
            S_private[ithread*10+n] += A[m];
        }
    }
    #pragma omp for
    for(int i=0; i<10; i++) {
        for(int t=0; t<nthreads; t++) {
            S[i] += S_private[10*t + i];
        }
    }
}
delete[] S_private;






reduction