Offload 其他函数

into
alloc_if 和 free_if
Applying the target Attribute to Multiple Declarations

into

使用into可以将一个变量的值上传到另外一个变量中, 比如in (a into(b)), 表示将CPU上变量a的值赋给MIC上的变量b, 也可以out(b into(c)) 将MIC上变量b的值传回给CPU上的变量c. 需要注意的地方是into 只能用于in或者out中, 不能用于inout或者nocopy中. 下面是使用示例:

#include <stdio.h>

void init_array(int* arr, int n, int start_num){
    int i;
    for(i = 0; i < n; i++) {
        arr[i] = start_num + i;
    }
}

void use_into() {
    int n = 3, i;
    int p[n], p1[n];

    init_array(p, n, 0);
    init_array(p1, n, n);

    for(i = 0; i < n; i++) {
        printf("before offload:  p[%d] is %d\n", i, p[i]);
    }
    for(i = 0; i < n; i++) {
        printf("before offload: p1[%d] is %d\n", i, p1[i]);
    }

    printf("==============================\n");
    //into 将一个变量的值上传到另外一个变量中,如下在mic上p没有值,只有p1有值, 调用out之后原先p1的值会改变
#pragma offload target(mic) in(p[0:n] : into(p1[0:n])) out(p1)
    {
        for(i = 0; i < n; i++) {
            printf("On Mic:  p[%d] is %d\n", i, p[i]);
        }
        for(i = 0; i < n; i++) {
            printf("On Mic: p1[%d] is %d\n", i, p1[i]);
        }
    }

    for(i = 0; i < n; i++) {
        printf("after offload:  p[%d] is %d\n", i, p[i]);
    }
    for(i = 0; i < n; i++) {
        printf("after offload: p1[%d] is %d\n", i, p1[i]);
    }

    printf("==============================\n");
}

void use_into2() {
    int n = 4, i;
    int p[n], p1[n+1], p2[n-1];

    init_array(p, n, 0);
    init_array(p1, n+1, n);
    init_array(p2, n-1, 2*n+1);

    for(i = 0; i < n; i++) {
        printf("before offload:     p[%d] is %d\n", i, p[i]);
    }
    for(i = 0; i < n+1; i++) {
        printf("before offload: p1[%d] is %d\n", i, p1[i]);
    }
    for(i = 0; i < n-1; i++) {
        printf("before offload: p2[%d] is %d\n", i, p2[i]);
    }
    printf("==============================\n");
    // 当数组长度不一样时, 当length(p) < length(p1)时, p1数组多余的部分会补0
    // 当length(p) > length(p2)时, in的时候需要注意p的长度不可大于p2的长度
#pragma offload target(mic) in(p[0:n]:into(p1[0:n+1])) in(p[0:n-1]:into(p2[0:n-1])) out(p1) out(p2)
    {
        for(i = 0; i < n; i++) {
            printf("on mic:  p[%d] is %d\n", i, p[i]);
        }
        for(i = 0; i < n+1; i++) {
            printf("on mic: p1[%d] is %d\n", i, p1[i]);
        }
        for(i = 0; i < n-1; i++) {
            printf("on mic: p2[%d] is %d\n", i, p2[i]);
        }
    }

    for(i = 0; i < n; i++) {
        printf("after offload:  p[%d] is %d\n", i, p[i]);
    }
    for(i = 0; i < n+1; i++) {
        printf("after offload: p1[%d] is %d\n", i, p1[i]);
    }
    for(i = 0; i < n-1; i++) {
        printf("after offload: p2[%d] is %d\n", i, p2[i]);
    }
    printf("==============================\n");
}

// 将一维数组放到二维数组里以及二维数组放到一维数组,
// 文档中说不可以, 但是这里确实可以使用
void use_into3() {
    int n = 10, i;
    int p[n * n];
    int a[n][n];

    init_array(p, n * n, 0);
#pragma offload target(mic)  in(p:into(a)) out(a:into(p))
    {
        for(i = 0; i < n; i++) {
            printf("on mic: a[%d][0] is %d\n", i, a[i][0]);

        }

        // 相当于p[0]
        a[0][0] = 1000;
        // 相当于p[10]
        a[1][0] = 1000;
    }

    printf("p[0] is %d and p[10] is %d\n", p[0], p[10]);
    printf("==============================\n");
}

int main() {
    use_into();
    //use_into2();
    //use_into3();
}

alloc_if 和 free_if

对于指针变量来说, 每次执行offload都会为其分配新的内存, 当offload执行完之后, 就会将该内存释放掉. 为了能够重用前面offload所开辟的空间, mic提供了alloc_if和free_if来显示指定是否为offload的指针变量(非指针变量使用alloc_if和free_if会报错)分配新的内存以及执行完offload后是否释放该内存. 下面是具体含义:

alloc_if(1) - offload时为指针分配新的内存
alloc_if(0) - offload时不开辟新的内存, 而是使用前面保留的内存
free_if(1) - offload执行完成后, 释放掉为该指针分配的内存
free_if(0) - offload执行完成后, 不释放指针对应的内存

默认值是alloc_if(1) 和 free_if(1), 为了使程序更加清晰, 我们预定义几个宏

#define ALLOC alloc_if(1)
#define FREE free_if(1)
#define RETAIN free_if(0)
#define REUSE alloc_if(0)

下面是具体的示例代码:

#include <stdio.h>
#include <stdlib.h>

#define ALLOC alloc_if(1)
#define FREE free_if(1)
#define RETAIN free_if(0)
#define REUSE alloc_if(0)

void init_array(int* arr, int n, int start_num){
    int i;
    for(i = 0; i < n; i++) {
        arr[i] = start_num + i;
    }
}

// 当mic上没有未释放的内存时, 使用alloc_if(0)会报错
void reuse_before_alloc() {
    int n = 10;
    int *p =(int*) calloc(n, sizeof(int));
    int i;
    init_array(p, n, 0);
    //当然这是错的offload error: cannot find data associated with pointer variable 0x15e2c60
    //因为没有已有的内存
#pragma offload target(mic) in(p:length(10) REUSE)
    {
        for(i = 0; i < n; i++) {
            printf("the p[%d] id %d\n", i, p[i]);
        }
    }
    free(p);
}

//这里保存内存, 在下面执行reuse, reuse2 之前都应该先执行该函数在MIC上保存内存.
void retain() {

    int n = 10;
    int *p =(int*) calloc(n, sizeof(int));
    int i;
    init_array(p, n, 0);
#pragma offload target(mic) in(p:length(n) RETAIN)
    {
        for(i = 0; i < n; i++) {
            printf("retain: the p[%d] id %d\n", i, p[i]);
        }
    }
    free(p);
}

//这里使用上面保存的内存空间
void reuse() {
    int n = 10;
    int *p =(int*) calloc(n, sizeof(int));
    int i;
    init_array(p, n, 0);
    //如果不加retain会默认释放掉该内存
#pragma offload target(mic) in(p:length(n) REUSE)
    {
        for(i = 0; i < n; i++) {
            printf("reuse: the p[%d] id %d\n", i, p[i]);
        }
    }
    free(p);
}

// 重用的内存不可以大于MIC上已保存的内存, 小于是可以的
void reuse2() {
    // 如果n=11就会报错
    int n = 9;
    int *p =(int*) calloc(n, sizeof(int));
    int i;
    init_array(p, n, 0);
#pragma offload target(mic) in(p:length(n) REUSE)
    {
        for(i = 0; i < n; i++) {
            printf("reuse: the p[%d] is %d\n", i, p[i]);
        }
    }
    free(p);
}


int main(){

    //    reuse_before_alloc();

    retain();
    reuse();

    //    retain();
    //    reuse2();

    return 0;
}

还有一个问题就是重用内存的时候好像是不需要两个变量名相同, 看下面的代码

void retain() {

    int n = 10;
    int *p =(int*) calloc(n, sizeof(int));
    int i;
    init_array(p, n, 0);
#pragma offload target(mic) in(p:length(n) RETAIN)
    {
        for(i = 0; i < n; i++) {
            printf("retain: the p[%d] id %d\n", i, p[i]);
        }
    }
    free(p);
}

void reuse() {
    int n = 10;
    int *p2 =(int*) calloc(n, sizeof(int));
    int i;
    init_array(p2, n, 0);
#pragma offload target(mic) in(p2:length(n) REUSE)
    {
        for(i = 0; i < n; i++) {
            printf("reuse: the p2[%d] is %d\n", i, p2[i]);
        }
    }
    free(p2);

}

首先执行retain, 然后在执行reuse, 程序仍然可以正常运行.

Applying the target Attribute to Multiple Declarations

当有多个变量或者函数需要在MIC上使用时, 我们可以采用一种较为方便的声明方式为这些变量和函数加上 target(mic) 的属性, 下面是声明方式:

#pragma offload_attribute(push, target(mic))
...
#pragma offload_attribute(pop)

在两个#pragma之间声明的变量和函数都可以在mic上运行, 如果要声明共享虚拟内存模式下使用的共享变量和函数, 可以采用下面的形式

#pragma offload_attribute(push, _Cilk_shared)
...
#pragma offload_attribute(pop)

下面是一个示例:

#pragma offload_attribute(push, target(mic))
#include <stdio.h>
#include <stdlib.h>

void test1();
void test2();
#pragma offload_attribute(pop)

int main() {
#pragma offload target(mic)
    test1();

#pragma offload target(mic)
    test2();
}

void test1() {
    printf("this is test1\n");
}

void test2() {
    printf("this is test2\n");
}

offload 其他函数