类库 › llm_benchmark
llm2014

llm2014/llm_benchmark

这是一个个人维护的大语言模型评测项目,使用滚动更新的私有题库长期跟踪评估多个大模型在逻辑、数学、编程和人类直觉等方面的能力。通过自动化评分系统生成排行榜,侧重观察模型的长期进化趋势。

1,211 10 1,211 12
在 GitHub 上查看

评论

Главная - Вики-сайт
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-06-07 13:56
浙ICP备14020137号-1 $Гость$