LalaEval：面向领域大模型的端到端人工评测框架

反馈

развернуть

出处：mp.weixin.qq.com

LalaEval是一个针对领域大模型的评测框架，通过争议度和评分波动分析，自动纠正人工主观错误，生成高质量QA对。框架包括领域界定、能力指标、评测集生成、评测标准和结果分析等五部分。采用单盲测试和评分争议度分析，确保评分客观公正。适用于多个领域，具有高可拓展性。

阅读原文

山岭爷爷于 2025-01-22 分享

2961

关联话题： #货拉拉

欢迎在评论区写下你对这篇文章的看法。

据说喜欢分享的,后来都成了大神

我已经到了法定结婚年龄，请问去民政局领证的时候，老婆是自己带还是等他们发？