类库 › ToolCall-15
stevibe

stevibe/ToolCall-15

ToolCall-15 是一个用于评估和比较大型语言模型(LLM)工具使用能力的可视化基准测试工具。它通过运行15个固定的测试场景,模拟工具调用环境,并按照预定义的规则(通过/部分通过/失败)对模型响应进行确定性评分。结果以实时仪表板形式展示,便于直观对比和分析模型在不同工具使用场景下的实际表现。

stevibe/ToolCall-15

技术栈

根目录 javascript

框架

Next.js latest React latest

代码规范

ESLint latest
查看全部依赖 (10)

依赖

@benchlocal/core file:../BenchLocal/packages/benchlocal-core @benchlocal/sdk file:../BenchLocal/packages/benchlocal-sdk lucide-react ^1.7.0 react-dom latest

开发依赖

@types/node latest @types/react latest @types/react-dom latest eslint-config-next latest tsc-alias ^1.8.10 typescript latest

评论

Home - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-19 18:56
浙ICP备14020137号-1 $Map of visitor$