类库
› ml-ssd
apple/ml-ssd
这个仓库实现了论文《简单自蒸馏改进代码生成》的方法,通过三个步骤提升代码生成模型效果:从冻结模型采样解决方案、使用标准交叉熵对未验证输出进行微调、用独立调优的温度解码。无需奖励模型、验证器或强化学习。
截图
这个仓库实现了论文《简单自蒸馏改进代码生成》的方法,通过三个步骤提升代码生成模型效果:从冻结模型采样解决方案、使用标准交叉熵对未验证输出进行微调、用独立调优的温度解码。无需奖励模型、验证器或强化学习。
Accueil
-
Wiki
Copyright © 2011-2026 iteam.
Current version is 2.155.1.
UTC+08:00, 2026-04-20 18:47
浙ICP备14020137号-1
$Carte des visiteurs$