基于多模态微调的UI缺陷检测
如果无法正常显示,请先停止浏览器的去广告插件。
1. 基于多模态微调的UI缺陷检测
海亮 - 美团技术专家
美团质效技术部
1
2. 录
3. 1.UI缺陷检测现状
3
4. UI缺陷检测现状
组件遮挡
5. UI缺陷检测现状
6. UI缺陷检测现状
7. UI缺陷检测现状
<think>
通
模型
1. 检查
整体布局:从截图来看,
模块
分布清晰,包括标题、 期选择、数量选
择、优惠信息、 付 式和底部提交按钮等
模块。
2. 检查是否存在UI重叠或遮挡:未发现模块之
间有重叠或遮挡的情况。
…
综合来看,
布局合理,未发现明显的UI展示
问题。</think><answer>不存在UI展示问题。</
answer>
7
8. UI缺陷检测现状
数据隔离
公开数据
通
专业领域
模型
微调模型
8
• LLM
• 专业数据不公开,
检索
• 测试是业务和
专业领域
模型的能
来
公开数据
法通过
络
程都相关的综合
9. 2.训练专家模型
9
10. UI缺陷检测现状
RAG VS
FT微调
• Token level 输 query,召回知识
检索任务,不改推理模式
• Weight level 模型权重,理解深度特
征,改变推理模式
• 多模态不适合召回,
相关性
RAG
FT
10
,
和缺陷不存在
11. 训练专家模型
多模态模型基本结构
11
• 视觉多模态模型有视觉编码器Vision
Encoder,位置编码Position Encoder,
相 纯 本模型结构更复杂,可训练参数
更多
• 多模态的训练同时需图像和
本数据
12. 训练专家模型
准备训练数据
训练模型
训练数据
• 实际UI缺陷数据很少
• 合成数据
• 合成数据训练,真实数据评测
需标注
12
评测和应
13. 训练专家模型
合成数据Pipeline
训练数据
实际场景
• 数据配 ,好的训练题总能预测到
真题 - 对应 场景的深 理解
• 实际业务UI缺陷分布的预测
13
14. 训练专家模型
摸索 - RL强化学习
调整策略
评测结果
15. 训练专家模型
SFT训练
15
• 训练卡 - GPU x 1
• 训练 式 - 7B VLM模型,LoRA微调节
省GPU显存,速度快
• 数据量 - 200-300,仅
本推理模式
于让模型形成基
16. 训练专家模型
整体布
局较为清晰,元素之间的间距和对
现“
减券”
基
字与其右侧的“免费开通”按
钮之间存在重叠现象。这种重叠可能会
遮挡部分
字内容,影响
操作。除此之外,
明显的UI展示问题。
</think>
户的阅读和
其他部分未发现
17. 训练专家模型
RL训练
17
• 训练卡 - GPU x 1
• 训练
• 学习什么是对,同时理解什么是错
误,让模型产 推理能 ,有助于
在没有 过的场景下提升鲁棒性
式 - 7B VLM模型,LoRA
18. 训练专家模型
奖励打分
评价策略
优惠信息模块,按
钮遮挡,存在UI展
示问题
1.0
模型
更新参数
按钮布局清晰,UI
展示正常
18
0.0
19. 训练专家模型
GRPO训练
19
• 推理模型R1证明了GRPO有效性
• 奖励机制简单,可以是规则打分,
实现成本低
• Sampling策略,
理正例和反例
个batch同时推
20. 训练专家模型
21. 3.对
评测
21
22. 对
SFT和GRPO
<think>
从截图中可以看到,顶部的筛选栏中,
“神券”标签显示正常…</think>
<answer>
顶部筛选栏中,“密云区”和“通 距离”筛
选项的 字显示异常,存在溢出或截断
问题。
</answer>
23. 对
<think>从截图中可以看到,
上 的
顶部导航栏 </think>
<answer>
1.紫 提示模块中,“查找” 字被遮挡或
溢出,导致部分 字不可 。
2.状态提示模块中,“抱歉,暂 结果”下
出现了 个空 模块,内容被截断。
</answer>
24. 对
25. 对
点
GPT-4.1 1/25=5%
26. 4.总结和展望
26
27. 总结和展望
全景
28. 总结和展望
• UI检测
• iOS18升级测试,发版回归测试
• 2024.9-2025.1召回有效UI缺陷8个
均处理1.6w个测试场景
29. 总结和展望
户的阅读和操作</think>
字
30. 总结和展望
截屏
UI设计稿
优化
GPU
Mac
• 从UI设计稿学习检测规范
• 降低推理成本, 持Mac端侧推理,
不限于UI检测,多Agent专家
30
向
31. 总结和展望
能
模型共同实现Agent能
,编排能
可以端到端后训练微调
32. Q&A
33. 欢迎加 美团
WX:13821200873
邮箱:caimanling@meituan.com
更多技术 货
欢迎关注“美团技术团队”