介绍
- TPUKernel 是算丰BM1684x 设备底层开发接口,利用该接口可以完成如下操作:
1.调用专用指令(如convolution、pooling等),实现深度学习业务逻辑的加速
2.调用通用指令(如矩阵乘法等),实现用户定制的各种算法加速。
- 该文档包含以下几方面内容:
BM1684x设备架构介绍。
BM1684x设备编程接口API(指令集封装)。
1.调用专用指令(如convolution、pooling等),实现深度学习业务逻辑的加速
2.调用通用指令(如矩阵乘法等),实现用户定制的各种算法加速。
BM1684x设备架构介绍。
BM1684x设备编程接口API(指令集封装)。