类库
› ToolCall-15
stevibe/ToolCall-15
ToolCall-15 是一个用于评估和比较大型语言模型(LLM)工具使用能力的可视化基准测试工具。它通过运行15个固定的测试场景,模拟工具调用环境,并按照预定义的规则(通过/部分通过/失败)对模型响应进行确定性评分。结果以实时仪表板形式展示,便于直观对比和分析模型在不同工具使用场景下的实际表现。
技术栈
根目录 javascript
框架
Next.js
latest
React
latest
代码规范
ESLint
latest
查看全部依赖 (10)
依赖
@benchlocal/core
file:../BenchLocal/packages/benchlocal-core
@benchlocal/sdk
file:../BenchLocal/packages/benchlocal-sdk
lucide-react
^1.7.0
react-dom
latest
开发依赖
@types/node
latest
@types/react
latest
@types/react-dom
latest
eslint-config-next
latest
tsc-alias
^1.8.10
typescript
latest