类库
› MSA
MiniMax-AI/MSA
MSA是专为NVIDIA SM100 GPU设计的稀疏注意力内核库。它提供密集FlashAttention和稀疏top-k注意力功能,支持FP8/BF16等精度。通过JIT编译实现高性能计算,适用于大模型推理与训练场景。
技术栈
python/fmha_sm100/cute python
查看全部依赖 (2)
依赖
nvidia-cutlass-dsl
quack-kernels
根目录 python
查看全部依赖 (8)
依赖
apache-tvm-ffi
cuda-python
jinja2
ninja
nvidia-cutlass-dsl
pybind11
quack-kernels
torch
截图