类库
› opencompass
open-compass/opencompass
OpenCompass是一个大型语言模型综合评估平台,支持评估Llama、GPT、Claude等众多主流模型,涵盖超过100种数据集,并提供算法、界面和排行榜等工具。
截图
OpenCompass是一个大型语言模型综合评估平台,支持评估Llama、GPT、Claude等众多主流模型,涵盖超过100种数据集,并提供算法、界面和排行榜等工具。