7.3. TPU算力
7.3.1. BM1684 性能测试
本节我们列举了BM1684 TPU算力数据,此外,我们附上了每一个性能测试的测试命令,您可以按照表格中的测试命令进行验证。
注解
目前新版本SophonSDK不支持BM1684 TPU算力测试,您可以使用 BMNNSDK 2.7.0 或者 SOPHONSDK 3.0.0 进行测试 (仅支持 FP32/INT8 测试)。
若您使用 BMNNSDK 2.7.0, 您需要进入docker环境,并 source 环境变量。
若您使用 SOPHONSDK 3.0.0, 您需要将此文件 http://219.142.246.77:65000/sharing/1IVcX1dgx 放至 SOPHONSDK 3.0.0 的 bin 目录下,并进入 docker 环境 与 source 环境变量。
TPU算力性能测试 |
||
芯片 |
模型 |
test_perf指令 |
1684 |
FP32 |
进入docker环境,source环境变量,执行命令: 1test_perf 0 fp32 conv 10 20 64 256 256 64 15 15 10 10 1 1
![]() |
INT 8 |
进入docker环境,source环境变量,执行命令: 1int8 conv 5 20 64 256 256 64 15 15 10 10 1 1
![]() |
7.3.2. BM1684X 性能测试
本节我们列举了BM1684X TPU算力数据,此外,我们附上了每一个性能测试的测试命令,您可以按照表格中的测试命令进行验证。
注解
您可以在新版SophonSDK的环境下进行测试。由于测试脚本需要依赖于LIBSOPHON和驱动环境,所以您需要参考【安装SDK】小节首先安装LIBSOPHON环境。
测试环境搭建流程如下:
1#进入SophonSDK 下的 tpu-kernel_<date>_<hash> 2#解压tpu-kernel_v<VERSION>_<COMMIT>_<DATE>.tar.gz并进入解压出的目录 3 4source scripts/envsetup.sh 5 6# 环境初始化完成后,默认在PCIE模式下,命令行提示符最左边有 `(pcie)` 提示。 7(pcie)my/current/work/path $ 8 9# 进入sample目录 10cd samples 11mkdir build && cd build 12cmake ../ 13make firmware 14make load 15 16# 加载成功后,可以用dmesg命令,会有以下字样的输出 17#... 18[ 14.505087] bmdrv: bmsophon0 firmware init done!, status = 0x6125438 19[ 14.505168] bmdrv: firmware load success! 20#... 21 22# 编译主机的应用程序 23make -j
TPU算力性能测试 |
|||
芯片 |
操作 |
模型 |
test_perf指令 |
1684X |
CONV |
FP32 |
执行命令: 1./tpu_test_instrutions INS_CONV DT_FP32
![]() |
FP16 |
执行命令: 1./tpu_test_instrutions INS_CONV DT_FP16
![]() |
||
INT8 |
执行命令: 1./tpu_test_instrutions INS_CONV DT_INT8
![]() |
||
MAT MUL 2 |
FP16 |
执行命令: 1./tpu_test_instrutions INS_MAT_MUL2 DT_FP16
![]() |
|
INT8 |
执行命令: 1./tpu_test_instrutions INS_MAT_MUL2 DT_INT8
![]() |