ACL 2025 | Revisiting Self-Consistency: 动态分布对齐视角下的大模型投票策略

摘要

【摘要】小红书与北理工团队提出动态温度校准方法,优化大模型推理中的自洽性机制。研究发现,采样温度影响答案分布收敛速度与准确性,传统固定温度策略存在局限。新方法通过实时置信度动态调节温度,平衡多样性与收敛效率,在数学推理任务中显著提升效果。实验证明,该策略在有限样本下表现更优,为自洽性机制提供了理论新解。

欢迎在评论区写下你对这篇文章的看法。

评论

首页 - Wiki
Copyright © 2011-2025 iteam. Current version is 2.144.0. UTC+08:00, 2025-06-07 00:00
浙ICP备14020137号-1 $访客地图$