在DeepSeek阴影（或启发）下：OpenAI o1、Kimi 1.5、Qwen 2.5技术路线解读

온라인도구

온라인도구

反馈

온라인도구

홈 항목

글 코드베이스 상점

자세히

在 DeepSeek 阴影（或启发）下：OpenAI o1 、 Kimi 1.5 、 Qwen 2.5 技术路线解读

出处：mp.weixin.qq.com

摘要

大语言模型技术不断进步，OpenAI o1通过自我反思和错误修正提升推理能力，可能融合了CoT、PRM和MCTS；Kimi 1.5结合长上下文CoT和强化学习，展现了深入推理的潜力；Qwen 2.5则注重数据质量和多规模模型，配合离线与在线强化学习进一步提升性能。这些模型在推理、长文本处理和强化学习方面各有创新，推动了大语言模型的发展。

阅读原文

xiaozi 于 2025-03-14 分享

4957

关联话题： #Qwen #DeepSeek #Kimi

欢迎在评论区写下你对这篇文章的看法。