有一个需求,需要对for循环中创建的动态数组进行操作,记录一下历程:
最开始在函数开头定义了循环变量i和动态数组trace,并紧接着用malloc对trace分配空间,在for循环的前一行用#pragma omp for private(i)能编译成功,但结果错误。分析原因是因为每次循环都共享了trace,导致计算错误;
然后将for前定义改为#pragma omp for private(i,trace),编译出现段错误;
https://www.coder.work/article/1564167给出了解决问题的正确方法:先用omp定义parallel块,然后动态分配内存,再用omp开启for循环,结束for循环后释放内存,并结束parallel块。如下:
#pragma omp parallel num_threads(40) private(i,trace)
{ // parallel 块是需要大括号的
trace=(float *)malloc(sizeof(float)*sz);
# pragma omp for
for(i=0;i<len;i++)
{
trace=xxxxxxx;
.......
}
free(trace);
}