基于多模态微调的UI缺陷检测

如果无法正常显示,请先停止浏览器的去广告插件。
分享至:
1. 基于多模态微调的UI缺陷检测 海亮 - 美团技术专家 美团质效技术部 1
2. 录
3. 1.UI缺陷检测现状 3
4. UI缺陷检测现状 组件遮挡
5. UI缺陷检测现状
6. UI缺陷检测现状
7. UI缺陷检测现状 <think> 通 模型 1. 检查 整体布局:从截图来看, 模块 分布清晰,包括标题、 期选择、数量选 择、优惠信息、 付 式和底部提交按钮等 模块。 2. 检查是否存在UI重叠或遮挡:未发现模块之 间有重叠或遮挡的情况。 … 综合来看, 布局合理,未发现明显的UI展示 问题。</think><answer>不存在UI展示问题。</ answer> 7
8. UI缺陷检测现状 数据隔离 公开数据 通 专业领域 模型 微调模型 8 • LLM • 专业数据不公开, 检索 • 测试是业务和 专业领域 模型的能 来 公开数据 法通过 络 程都相关的综合
9. 2.训练专家模型 9
10. UI缺陷检测现状 RAG VS FT微调 • Token level 输 query,召回知识 检索任务,不改推理模式 • Weight level 模型权重,理解深度特 征,改变推理模式 • 多模态不适合召回, 相关性 RAG FT 10 , 和缺陷不存在
11. 训练专家模型 多模态模型基本结构 11 • 视觉多模态模型有视觉编码器Vision Encoder,位置编码Position Encoder, 相 纯 本模型结构更复杂,可训练参数 更多 • 多模态的训练同时需图像和 本数据
12. 训练专家模型 准备训练数据 训练模型 训练数据 • 实际UI缺陷数据很少 • 合成数据 • 合成数据训练,真实数据评测 需标注 12 评测和应
13. 训练专家模型 合成数据Pipeline 训练数据 实际场景 • 数据配 ,好的训练题总能预测到 真题 - 对应 场景的深 理解 • 实际业务UI缺陷分布的预测 13
14. 训练专家模型 摸索 - RL强化学习 调整策略 评测结果
15. 训练专家模型 SFT训练 15 • 训练卡 - GPU x 1 • 训练 式 - 7B VLM模型,LoRA微调节 省GPU显存,速度快 • 数据量 - 200-300,仅 本推理模式 于让模型形成基
16. 训练专家模型 整体布 局较为清晰,元素之间的间距和对 现“ 减券” 基 字与其右侧的“免费开通”按 钮之间存在重叠现象。这种重叠可能会 遮挡部分 字内容,影响 操作。除此之外, 明显的UI展示问题。 </think> 户的阅读和 其他部分未发现
17. 训练专家模型 RL训练 17 • 训练卡 - GPU x 1 • 训练 • 学习什么是对,同时理解什么是错 误,让模型产 推理能 ,有助于 在没有 过的场景下提升鲁棒性 式 - 7B VLM模型,LoRA
18. 训练专家模型 奖励打分 评价策略 优惠信息模块,按 钮遮挡,存在UI展 示问题 1.0 模型 更新参数 按钮布局清晰,UI 展示正常 18 0.0
19. 训练专家模型 GRPO训练 19 • 推理模型R1证明了GRPO有效性 • 奖励机制简单,可以是规则打分, 实现成本低 • Sampling策略, 理正例和反例 个batch同时推
20. 训练专家模型
21. 3.对 评测 21
22. 对 SFT和GRPO <think> 从截图中可以看到,顶部的筛选栏中, “神券”标签显示正常…</think> <answer> 顶部筛选栏中,“密云区”和“通 距离”筛 选项的 字显示异常,存在溢出或截断 问题。 </answer>
23. 对 <think>从截图中可以看到, 上 的 顶部导航栏 </think> <answer> 1.紫 提示模块中,“查找” 字被遮挡或 溢出,导致部分 字不可 。 2.状态提示模块中,“抱歉,暂 结果”下 出现了 个空 模块,内容被截断。 </answer>
24. 对
25. 对 点 GPT-4.1 1/25=5%
26. 4.总结和展望 26
27. 总结和展望 全景
28. 总结和展望 • UI检测 • iOS18升级测试,发版回归测试 • 2024.9-2025.1召回有效UI缺陷8个 均处理1.6w个测试场景
29. 总结和展望 户的阅读和操作</think> 字
30. 总结和展望 截屏 UI设计稿 优化 GPU Mac • 从UI设计稿学习检测规范 • 降低推理成本, 持Mac端侧推理, 不限于UI检测,多Agent专家 30 向
31. 总结和展望 能 模型共同实现Agent能 ,编排能 可以端到端后训练微调
32. Q&A
33. 欢迎加 美团 WX:13821200873 邮箱:caimanling@meituan.com 更多技术 货 欢迎关注“美团技术团队”

- 위키
Copyright © 2011-2025 iteam. Current version is 2.144.1. UTC+08:00, 2025-07-16 14:15
浙ICP备14020137号-1 $방문자$