类库 › MSA
MiniMax-AI

MiniMax-AI/MSA

MSA是专为NVIDIA SM100 GPU设计的稀疏注意力内核库。它提供密集FlashAttention和稀疏top-k注意力功能,支持FP8/BF16等精度。通过JIT编译实现高性能计算,适用于大模型推理与训练场景。

MiniMax-AI/MSA

技术栈

python/fmha_sm100/cute python

查看全部依赖 (2)

依赖

nvidia-cutlass-dsl quack-kernels

根目录 python

查看全部依赖 (8)

依赖

apache-tvm-ffi cuda-python jinja2 ninja nvidia-cutlass-dsl pybind11 quack-kernels torch

截图

MSA architecture

评论

Home - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-06-13 22:49
浙ICP备14020137号-1 $Map of visitor$