类库 › skill
pinchbench

pinchbench/skill

PinchBench是用于评估LLM模型作为OpenClaw编码代理性能的基准测试系统。它通过真实任务(如日程安排、代码编写、邮件处理等)测试AI编码代理的工具使用、多步推理和实际执行能力,并提供公开排行榜展示结果。

评论

首页 - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-02 12:47
浙ICP备14020137号-1 $访客地图$