llm2014/llm_benchmark - Онлайн - инструменты

Онлайн - инструменты

Онлайн - инструменты

反馈

Онлайн - инструменты

Главная тема

Библиотека Библиотека кодов Магазин

развернуть

类库 › llm_benchmark

llm2014/llm_benchmark

这是一个个人维护的大语言模型评测项目，使用滚动更新的私有题库长期跟踪评估多个大模型在逻辑、数学、编程和人类直觉等方面的能力。通过自动化评分系统生成排行榜，侧重观察模型的长期进化趋势。

1,211 10 1,211 12

在 GitHub 上查看

相关项目

评论

项目信息

默认分支: main
所有者: llm2014 User
创建时间: 2025-02-07
最近提交: 4天前
最近更新: 2天前
收录时间: 2026-03-20

支持平台

Web CLI

Главная - Вики-сайт
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-06-07 13:56
浙ICP备14020137号-1 $Гость$