类库
› DeepSpec
deepseek-ai/DeepSpec
DeepSpec是用于训练和评估推测解码算法中草稿模型的全栈代码库。它提供数据准备、模型实现、训练及评估脚本,支持多GPU环境下的模型训练与基准测试,适用于大语言模型的加速推理研究。
技术栈
根目录 python
查看全部依赖 (13)
依赖
NumPy
PyYAML
datasets
matplotlib
openai
safetensors
sentencepiece
tensorboard
torch
tqdm
transformers
triton
typing_extensions