类库
› VibeSearchBench
VibeBench/VibeSearchBench
VibeSearchBench是一个针对模糊多轮主动搜索的基准测试数据集,包含200个长周期任务。它通过人格驱动的渐进式披露模拟用户行为,并利用无模式知识图谱进行可验证的三元组F1评分,旨在评估搜索引擎在复杂场景下的性能。
技术栈
根目录 python
查看全部依赖 (5)
依赖
aiohttp
httpx
openai
pyyaml
tqdm