7.3. TPU算力

7.3.1. BM1684 性能测试

本节我们列举了BM1684 TPU算力数据,此外,我们附上了每一个性能测试的测试命令,您可以按照表格中的测试命令进行验证。

注解

目前新版本SophonSDK不支持BM1684 TPU算力测试,您可以使用 BMNNSDK 2.7.0 或者 SOPHONSDK 3.0.0 进行测试 (仅支持 FP32/INT8 测试)。

  1. 若您使用 BMNNSDK 2.7.0, 您需要进入docker环境,并 source 环境变量。

  2. 若您使用 SOPHONSDK 3.0.0, 您需要将此文件 http://219.142.246.77:65000/sharing/1IVcX1dgx 放至 SOPHONSDK 3.0.0 的 bin 目录下,并进入 docker 环境 与 source 环境变量。

TPU算力性能测试

芯片

模型

test_perf指令

1684

FP32

进入docker环境,source环境变量,执行命令:

1test_perf 0 fp32 conv 10 20 64 256 256 64 15 15 10 10 1 1
../_images/1684_conv_fp32.png

INT 8

进入docker环境,source环境变量,执行命令:

1int8 conv 5 20 64 256 256 64 15 15 10 10 1 1
../_images/1684_conv_int8.png

7.3.2. BM1684X 性能测试

本节我们列举了BM1684X TPU算力数据,此外,我们附上了每一个性能测试的测试命令,您可以按照表格中的测试命令进行验证。

注解

您可以在新版SophonSDK的环境下进行测试。由于测试脚本需要依赖于LIBSOPHON和驱动环境,所以您需要参考【安装SDK】小节首先安装LIBSOPHON环境。

测试环境搭建流程如下:

 1#进入SophonSDK 下的 tpu-kernel_<date>_<hash>
 2#解压tpu-kernel_v<VERSION>_<COMMIT>_<DATE>.tar.gz并进入解压出的目录
 3
 4source scripts/envsetup.sh
 5
 6# 环境初始化完成后,默认在PCIE模式下,命令行提示符最左边有 `(pcie)` 提示。
 7(pcie)my/current/work/path $
 8
 9# 进入sample目录
10cd samples
11mkdir build && cd build
12cmake ../
13make firmware
14make load
15
16# 加载成功后,可以用dmesg命令,会有以下字样的输出
17#...
18[ 14.505087] bmdrv: bmsophon0 firmware init done!, status = 0x6125438
19[ 14.505168] bmdrv: firmware load success!
20#...
21
22# 编译主机的应用程序
23make -j

TPU算力性能测试

芯片

操作

模型

test_perf指令

1684X

CONV

FP32

执行命令:

1./tpu_test_instrutions INS_CONV DT_FP32
../_images/1684x_conv_fp32.png

FP16

执行命令:

1./tpu_test_instrutions INS_CONV DT_FP16
../_images/1684x_conv_fp16.png

INT8

执行命令:

1./tpu_test_instrutions INS_CONV DT_INT8
../_images/1684x_conv_int8.png

MAT MUL 2

FP16

执行命令:

1./tpu_test_instrutions INS_MAT_MUL2 DT_FP16
../_images/1684x_mul_fp16.png

INT8

执行命令:

1./tpu_test_instrutions INS_MAT_MUL2 DT_INT8
../_images/1684x_mul_int8.png