类库
› claimpilot-harness
samarailly51-pixel/claimpilot-harness
ClaimPilot Harness是保险理赔AI Agent的评测与红队测试框架。它通过模拟冲突证据、Prompt注入等真实场景,对Agent进行碰撞测试,提供确定性评分、失败回放及横向对比功能,确保Agent上线前的可靠性。
ClaimPilot Harness是保险理赔AI Agent的评测与红队测试框架。它通过模拟冲突证据、Prompt注入等真实场景,对Agent进行碰撞测试,提供确定性评分、失败回放及横向对比功能,确保Agent上线前的可靠性。