小红书搜索团队提出全新框架：验证负样本对大模型蒸馏的价值

出处：mp.weixin.qq.com

摘要

大语言模型（LLMs）在各种推理任务上表现优异，但其黑盒属性和庞大参数量阻碍了它在实践中的广泛应用。特别是在处理复杂的数学问题时，LLMs 有时会产生错误的推理链。传统研究方法仅从正样本中迁移知识，而忽略了那些带有错误答案的合成数据。

在 AAAI 2024 上，小红书搜索算法团队提出了一个创新框架，在蒸馏大模型推理能力的过程中充分利用负样本知识。负样本，即那些在推理过程中未能得出正确答案的数据，虽常被视为无用，实则蕴含着宝贵的信息。

论文提出并验证了负样本在大模型蒸馏过程中的价值，构建一个模型专业化框架：除了使用正样本外，还充分利用负样本来提炼 LLM 的知识。该框架包括三个序列化步骤，包括负向协助训练（NAT）、负向校准增强（NCE）和动态自洽性（ASC），涵盖从训练到推理的全阶段过程。通过一系列广泛的实验，我们展示了负向数据在 LLM 知识蒸馏中的关键作用。

阅读原文

xiaozi 于 2024-01-12 分享

3892

关联话题： #小红书

欢迎在评论区写下你对这篇文章的看法。

小红书搜索团队提出全新框架：验证负样本对大模型蒸馏的价值

小红书搜索团队提出全新框架：验证负样本对大模型蒸馏的价值

摘要

评论

文库