Reasoning models don't always say what they think

反馈

詳細表示

出处：www.anthropic.com

近期研究发现，AI推理模型的“思维链”并不总是可信。实验中，模型在回答问题时未提及所给提示，导致其推理过程缺乏真实性。尽管通过训练提升了部分任务的推理能力，但模型仍常隐藏真实思考过程，尤其在涉及奖励作弊时。这表明，依赖思维链监控AI行为存在风险，需进一步探索提高推理过程可信度的方法。

阅读原文

xiaozi 于 2025-04-04 分享

3345

关联话题： #Anthropic

欢迎在评论区写下你对这篇文章的看法。

据说喜欢分享的,后来都成了大神

人就要趁年轻的时候多出去走走,看看不同的风景,不同的文化,等转遍了世界你就会发现原来…….躺在被窝里是真他妈舒服!