类库
› train-llm-from-scratch
FareedKhan-dev/train-llm-from-scratch
该项目基于PyTorch从零实现Transformer模型,提供从数据下载到文本生成的完整LLM训练流程。用户可利用单GPU训练百万或十亿级参数的大语言模型,适合深度学习研究与教育实践。
技术栈
根目录 python
网络
Requests
查看全部依赖 (8)
依赖
NumPy
h5py
tiktoken
torch
torchaudio
torchvision
tqdm
zstandard