时间戳反混淆放假安排
在24G显存的单卡RTX 4090上,使用unsloth和lora量化微调技术,成功对62G的deepseek-ai/DeepSeek-R1-Distill-Qwen-32B模型进行全量微调。训练数据为24772条,共9288步,耗时28小时28分37秒。优化技术显著减少了显存占用,提升了训练效率。
欢迎在评论区写下你对这篇文章的看法。
Home - Wiki Copyright © 2011-2025 iteam. Current version is 2.142.0. UTC+08:00, 2025-02-19 13:50 浙ICP备14020137号-1 $Map of visitor$