类库 › train-llm-from-scratch
FareedKhan-dev

FareedKhan-dev/train-llm-from-scratch

该项目基于PyTorch从零实现Transformer模型,提供从数据下载到文本生成的完整LLM训练流程。用户可利用单GPU训练百万或十亿级参数的大语言模型,适合深度学习研究与教育实践。

技术栈

根目录 python

网络

Requests
查看全部依赖 (8)

依赖

NumPy h5py tiktoken torch torchaudio torchvision tqdm zstandard

评论

Главная - Вики-сайт
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-05-18 20:47
浙ICP备14020137号-1 $Гость$