单卡4090微调DeepSeek-R1-32B

Online Tools

Online Tools

Ranking List

Mine
Home
Tool
Library
Code Library
Software
Website Directory
Topic
Shop

反馈

Online Tools

Home Topic

Library Code Library Shop

Articles
Documents
Books
Albums

单卡 4090 微调 DeepSeek-R1-32B

出处：mp.weixin.qq.com

摘要

在24G显存的单卡RTX 4090上，使用unsloth和lora量化微调技术，成功对62G的deepseek-ai/DeepSeek-R1-Distill-Qwen-32B模型进行全量微调。训练数据为24772条，共9288步，耗时28小时28分37秒。优化技术显著减少了显存占用，提升了训练效率。

阅读原文

xiaozi 于 2025-02-14 分享

4564

关联话题： #DeepSeek #unsloth #Fine-tuning

欢迎在评论区写下你对这篇文章的看法。

据说喜欢分享的,后来都成了大神

知鸦日报

每日精选

提交句子

当幸福来敲门的时候，我怕我不在家，所以一直都很宅。

文库

1 AI 陪伴靠的不是更聪明：我做了一个会犯困、会生气、会陪我打游戏的 AI
2 OpenStack Nova 虚拟机网卡挂卸载性能优化实践
3 唯品会搜推的召回-混排-DAG 全链路改造： Java 业务工程的自我救赎之路
4 从文档驱动到 Demo 驱动，TRAE 产品经理如何用 SOLO 重塑工作流
5 5 人 7 天干完 20 人数周的活：Spec-Driven Development 如何重新定义 AI 编程
6 一个真实的智能客服RAG，数据准备到检索链路完整拆解
7 抖音动态体验优化实践与思考
8 How Informatica Built a Multi-Agent AI System to Reduce Data Workflows from Months to Days
9 UI 自动化演进：从 Selenium / Appium 到 Skill + Playwright 自然语言驱动
10 依托 Doubao-Seed-2.0-lite 打造“AI 电竞教练”的架构设计与工程落地
11 天猫新品团队AI编码实战指南（下）
12 AI Infra 其实没有多少新东西
13 Agent 时代的生产力悖论：当协作本身成为最大的瓶颈
14 From SSH to REST: A Security-Driven Modernization of Slack’s EMR Data Pipelines
15 Enhancing Flink Deployment with Shadow Testing