类库 › train-llm-from-scratch
FareedKhan-dev

FareedKhan-dev/train-llm-from-scratch

该项目基于PyTorch从零实现Transformer模型,提供从数据下载到文本生成的完整LLM训练流程。用户可利用单GPU训练百万或十亿级参数的大语言模型,适合深度学习研究与教育实践。

6,015 819 6,015 14
在 GitHub 上查看
FareedKhan-dev/train-llm-from-scratch

技术栈

根目录 python

网络

Requests
查看全部依赖 (8)

依赖

NumPy h5py tiktoken torch torchaudio torchvision tqdm zstandard

截图

Post-training pipeline: Base to SFT to RM/DPO to PPO/GRPO

评论

Home - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-06-14 06:46
浙ICP备14020137号-1 $Map of visitor$