PosterCraft- Rethinking High-Quality Aesthetic Poster Generation in a Unified model

如果无法正常显示,请先停止浏览器的去广告插件。
分享至:
1. PosterCraft: Rethinking High-Quality Aesthetic Poster Generation in a Unified model Jialin Gao 04/09/2026 美团基础研发平台
2. 目录 1研究简介 2背景挑战 3框架概述 4阶段优化 5结果分析
3. 目录 1研究简介 2背景挑战 3框架概述 4阶段优化 5结果分析
4. PosterCraft 是什么? 一句prompt生成文本渲染正确、艺术表达精准且设计布局和谐的高精美海报
5. 目录 1研究简介 2背景挑战 3框架概述 4阶段优化 5结果分析
6. 海报生成需要什么? Ø 精准与风格化文本(Precise & Stylistic Text) Ø 抽象艺术内容表达(Abstract Artistic Content) Ø 视觉冲击版式和谐(Striking Layout & Harmony)
7. 当前方案欠缺什么? 视觉一致性弱文字精度、效果差难以支持复杂版式 分段式解耦设计文字渲染能力不足缺乏高质量数据 模块结构陷阱基础模型瓶颈海报数据匮乏 错字 乱码 多字 少字
8. PosterCraft 要做什么? Vision-language feedback refinementStep4 Aesthetic-text reinforcement learningStep3 High-quality poster fine-tuningStep2 scalable text rendering optimizationStep1 High-Quality Aesthetic Poster Generation
9. 目录 1研究简介 2背景挑战 3框架概述 4阶段优化 5结果分析
10. PosterCraft 框架概述
11. 目录 1研究简介 2背景挑战 3框架概述 4阶段优化 5结果分析
12. PosterCraft 如何提升文本渲染 1. 文本与风格合成 (Content & Style) ü 混合生成策略 (Hybrid Strategy): ü 字体多样性 (Font Diversity): 2. 布局与几何策略 (Layout & Geometry) ü 网格分区 (3x3 Grid) ü 碰撞检测 (Collision Check) ü 多样化 (Orientation) 4. 结构化提示词 (Structured Prompts) ü 全自动标注 ü 多实例串联
13. PosterCraft 如何提升文本渲染 1. 文本与风格合成 (Content & Style) ü 混合生成策略 (Hybrid Strategy): ü 字体多样性 (Font Diversity): 2. 布局与几何策略 (Layout & Geometry) ü 网格分区 (3x3 Grid) ü 碰撞检测 (Collision Check) ü 多样化 (Orientation) 4. 结构化提示词 (Structured Prompts) ü 全自动标注 ü 多实例串联 Flux.1 dev baseline (left) v.s. Text-rendering optimized output (right)
14. PosterCraft 如何提升生图效果 区域感知校准 (Region-aware Calibration) 对不同区域进行针对性的优化: 1. 对非文本区域赋予最高权重,以最大限度地保留海报的整体艺术风格. 2. 对承载核心信息的主要文本赋予中等权重,确保其清晰度的同时允许其与背景融合 3. 对面积小且易出错的次要文本赋予最低权重,以防止模型过度关注而破坏画面。 通过此策略,模型学会了将文本视为构图的有机组成部分,而非简单的“贴图”,从而显 著提升了生成海报的整体视觉连贯性与艺术性。
15. PosterCraft 如何提升文字效果 数据构造 数据示例 Poster-Preference-100K数据集: ü 约20,000个创意提示生成 ü 总计100,000张高质量海报 ü 美学模型模拟人类美学偏好 ü VLM判断文字准确性剔除噪声 效果对比
16. PosterCraft 如何利用视觉语言反馈 Poster-Reflect-100K <GT image> “This evocative poster features Paul Atreides standing atop a sandy dune, gazing towards a vast expanse of desert …… Above, two moons are visible against a dramatic sky filled with fiery orange and brown clouds …… The overall aesthetic is cinematic and epic …… Centered at the bottom, the bold, stylized title reads \“DUNE,\” …… Below this, the words \“PART TWO\” are presented in a smaller, clean sans-serif font …… <Gen image1> <Gen image2> <Gen image3> 1 Caption <Gen image4> <Gen image5> FLUX 5 Posters 5 Reflections <Gen image1> <GT image> Internally compare the first poster against the seco nd poster …… provide detailed and specific suggesti ons in two aspects: 1. Poster Content Suggestions 2. Aesthetic Style Optimization Suggestions …… “Poster Content Suggestions”: “Replace the cen tral silhouetted figure with a detailed depiction of a character wearing armor and a flowing garment, po sitioned …… Modify the distant structures on the ho rizon to appear more organic, like rock formations r ather than geometric shapes ……” “Aesthetic style optimization suggestions”: “Enhance the rendering of the landscape to include greater detail and textur e on the dunes and ground, moving away from flat, stylized sh apes towards a more painterly and realistic appearance …… I ntroduce a richer, more varied color palette incorporating dee per oranges ……” 优化对比 视觉-语言反馈机制: 通过inference scaling 实现对生成结果的精细迭代, 以模拟人类设计师创作过程中的“审阅-修改”机制, 避免模型单次生成可能存在的细微语义或风格偏差
17. 目录 1研究简介 2背景挑战 3框架概述 4阶段优化 5结果分析
18. PosterCraft 实验分析 – 文本与美学
19. PosterCraft 实验分析 – ablation study & user study
20. PosterCraft 实验分析 – 方法对比 PosterCraft与其他方法对比 PosterCraft 基于SD3.5-Medium效果对比
21. Q&A

Accueil - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-06-21 10:00
浙ICP备14020137号-1 $Carte des visiteurs$