类库
› ml-ssd
apple/ml-ssd
这个仓库实现了论文《简单自蒸馏改进代码生成》的方法,通过三个步骤提升代码生成模型效果:从冻结模型采样解决方案、使用标准交叉熵对未验证输出进行微调、用独立调优的温度解码。无需奖励模型、验证器或强化学习。
截图
这个仓库实现了论文《简单自蒸馏改进代码生成》的方法,通过三个步骤提升代码生成模型效果:从冻结模型采样解决方案、使用标准交叉熵对未验证输出进行微调、用独立调优的温度解码。无需奖励模型、验证器或强化学习。