Skip to content

zhaocc1106/cuxx-programing

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

48 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

cuxx-programing

cuda、cublas、cublaslt、cusparse...

cuda

cuda实现一些算子

  • gemm:cuda实现不同版本的gemm并比较与cublas实现的性能。
  • reduce:cuda实现的reduce算法,包括sum、max、min、mean等。
  • sgemv:cuda实现sgemv并比较并比较与cublas实现的性能。
  • dot_product:cuda实现dot_product并比较与cublas实现的性能。
  • element_wise:cuda实现element_wise算子并比较与cublas实现的性能。
  • softmax:cuda实现softmax算子。
  • activiation: cuda实现一些激活函数。

cublas

cublas使用样例

cublaslt

cublaslt使用样例

cusparse

cusparse使用样例

About

cuda、cublas、cublaslt、cusparse...

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published