cuBLAS 是 NVIDIA CUDA 平台中的一个高性能数学库,提供在 GPU 上运行的 BLAS(Basic Linear Algebra Subprograms,基础线性代数子程序) 例程,用于向量与矩阵运算(如矩阵乘法、向量点积等)。常用于科学计算、深度学习与高性能计算。
/ˈkjuːblæs/
I used cuBLAS to speed up matrix multiplication on the GPU.
我用 cuBLAS 在 GPU 上加速矩阵乘法。
To reduce training time, the framework calls cuBLAS routines for optimized GEMM operations under the hood.
为了缩短训练时间,该框架在底层调用 cuBLAS 例程来优化执行 GEMM(通用矩阵乘法)运算。
cuBLAS 由 “cu-”(表示 CUDA 相关)与 BLAS(基础线性代数标准库接口的简称)组合而成,字面意思就是“CUDA 版的 BLAS”。它强调将传统 BLAS 线性代数操作迁移到 GPU 上实现高吞吐计算。