PCIe CPU

对于不方便使用 Tensor Computing Processor 加速的操作,需要 Processor 配合来完成。

如果是 SoC 模式,host端即为片上的ARM A53处理器,由它来完成Processor操作。

如果是 PCIe 模式,host端为用户的主机,Processor 操作可以选择在host端完成,也可以使用片上的ARM A53处理器来完成。两种实现方式各有优缺点:前者需要在device和host之间搬运输入输出数据,但运算性能可能优于ARM,所以用户可以根据自身host处理器性能、负载等实际情况选择最优的方式。默认情况下为前者,如果需要使用片上处理器可按照以下方式开启。

准备工作

如果要使能片上处理器,那么需要以下两个文件:

  • ramboot_rootfs.itb

  • fip.bin

需要将这两个文件所在的路径设置到程序运行的环境变量 BMCV_CPU_KERNEL_PATH 中, 如下:

$ export BMCV_CPU_KERNEL_PATH=/path/to/kernel_fils/

BMCV所有需要Processor操作的实现均在库 libbmcv_cpu_func.so 中,需要将该文件所在路径添加到程序运行的环境变量 BMCV_CPU_LIB_PATH 中,如下:

$ export BMCV_CPU_LIB_PATH=/path/to/lib/

目前需要Processor参与实现的API如下所示,如果没有使用以下API可忽略该功能。

num

API

1

bmcv_image_draw_lines

2

bmcv_image_erode

3

bmcv_image_dilate

4

bmcv_image_lkpyramid_execute

5

bmcv_image_morph

开启和关闭

用户可以在程序的开始结束处分别使用以下两个接口,即可分别实现该功能的开启和关闭。

bm_status_t bmcv_open_cpu_process(bm_handle_t handle);

bm_status_t bmcv_close_cpu_process(bm_handle_t handle);

传入参数说明:

  • bm_handle_t handle

    输入参数。 bm_handle 句柄。

返回值说明:

  • BM_SUCCESS: 成功

  • 其他:失败