Teaching Sidekick to say no: automated data curation with LLM judge consensus

摘要

训练数据存在盲区:生产日志只记录成功案例,模型无法学会拒绝不可能请求。我们利用小型人工标注数据集校准多个大模型作为裁判,通过严格共识机制自动标注冲突数据,形成数据飞轮。拒绝能力使评分提升28.9%,准确率86.3%,假阳性4.6%。

欢迎在评论区写下你对这篇文章的看法。

评论

Главная - Вики-сайт
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-06-26 23:42
浙ICP备14020137号-1 $Гость$