类库 › VibeSearchBench
VibeBench

VibeBench/VibeSearchBench

VibeSearchBench是一个针对模糊多轮主动搜索的基准测试数据集,包含200个长周期任务。它通过人格驱动的渐进式披露模拟用户行为,并利用无模式知识图谱进行可验证的三元组F1评分,旨在评估搜索引擎在复杂场景下的性能。

VibeBench/VibeSearchBench

技术栈

根目录 python

查看全部依赖 (5)

依赖

aiohttp httpx openai pyyaml tqdm

评论

- 위키
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-06-04 01:45
浙ICP备14020137号-1 $방문자$