cublas の使い方メモ
 · One min read
この記事は書きかけです。
cublasSetMatrix()
cublasStatus_t
cublasSetMatrix(int rows, int cols, int elemSize,
                const void *A, int lda, void *B, int ldb)
ホストメモリー上の行列 A から、GPU メモリー上にある行列 B に row × col の要素をコピーする関数。
各要素は elemSize バイトであり、行列は列優先で格納され、
先頭の次元はそれぞれ lda、ldb で指定する。
参考: https://docs.nvidia.com/cuda/cublas/index.html#cublassetmatrix
