类库
› cactus
cactus-compute/cactus
Cactus是一个针对移动设备和可穿戴设备的低延迟、高能效AI推理引擎。它提供OpenAI兼容的API接口,支持聊天、视觉、语音识别(STT)、检索增强生成(RAG)等功能,并利用零拷贝计算图和针对ARM架构优化的SIMD内核来实现高性能、低内存占用的模型部署。
标签
技术栈
查看全部依赖 (9)
依赖
einops
unknown
huggingface_hub
unknown
num2words
unknown
pillow
unknown
sentencepiece
unknown
timm
unknown
torch
unknown
torchvision
unknown
transformers
unknown
截图