从零开始的DeepSeek微调训练实战（SFT）

在线工具

在线工具

反馈

在线工具

首页话题

文库码库小摊

从零开始的 DeepSeek 微调训练实战（SFT）

出处：mp.weixin.qq.com

摘要

本文介绍了如何使用unsloth框架对DeepSeek R1 Distill 7B模型进行高效微调，特别是针对医疗推理数据集的微调实验。通过最小可行性实验，初步验证了微调的效果，并逐步扩展到完整数据集进行大规模微调。微调后的模型在回答医学问题时表现更加规范，但仍需进一步优化。最终，模型权重被合并保存，为后续应用打下基础。

阅读原文

xiaozi 于 2025-03-11 分享

4331

关联话题： #阿里巴巴 #DeepSeek #unsloth #Fine-tuning

欢迎在评论区写下你对这篇文章的看法。

据说喜欢分享的,后来都成了大神

知鸦日报

每日精选

提交句子

"立刻有的拼音是什么" "like you"