AIGC之AI绘画行业发展研究报告2023

如果无法正常显示，请先停止浏览器的去广告插件。

1. 无界 A I 研究、用户运营与高校业务团队 2 0 2 3 年 7 月

2. 目录（上）艺术篇 01 AI 绘画行业数据 02 各阶段 AI 艺术质量展示与进化测试篇 01 各行业案例图灵测试 02 无界 AI 行业案例展示技术篇 01 AIGC 诞生的历史脉络 02 大模型技术驱动下的落地案例 03 AIGC 产业全景图 04 GPT 的发展、技术原理与未来 05 什么是 AGI 03 顶级质量飞轮：商业化与泛娱乐化并进 04 真实世界模型：元宇宙照进平行世界 05 积极、消极、争议三面共存工具篇 01 Disco Diffusion 与 DALL·E 介绍与操作 02 详解 Midjourney 03 开源力量 Stable Diffusion 全解析 • 咒语实操 • 模型训练 • 生成视频 • 精准控制技术 04 工具流：如何结合与统一 MJ 与 SD

3. 目录（下）产业篇 01 就业问题 02 AI 时代创业公司结构 03 泛娱乐产业哲理篇 • 自媒体与 KOL • AIGC 资本主义出现 04 大产业 01 版权问题，社区的二元对立 02 法律判决，国家监管 03 从抵制到和解的必由之路 04 深入技术变革的哲学本质 • 影视制作 • 广告传媒 • 设计工具 • 食品包装 • 营销辅助 • 电商展示设计与跨境电商 • 服装模特与时尚设计 • 工具论 • 扩散模型技术原理 • ControlNet 实操：动漫制作与游戏产业 • 涌现与顿悟 • 室内设计 • 大模型的通用性 05 不止 AI 绘画：掌握全栈式 AIGC 工具流 06 结论与展望

4. 报告提纲  通过图灵测试，成为 AI “驾驭派”  窥探 AIGC 的第一性原理，从根本上预见无限的未来  追溯 AI 艺术的历史发展，感受进化的力量  掌握顶级 AI 绘画工具，拥抱变化，选择和解  AIGC 已经具备大范围赋能产业设计的可行性

5. 进入图灵测试…… 哪些人类，哪些 AI ？

6. <1/9> 服装时尚主题图灵测试

7. <2/9> 摄影主题图灵测试

8. <3/9> 电影制作主题图灵测试

9. <4/9> 中国山水画主题图灵测试

10. <5/9> 中国工笔画主题图灵测试

11. <6/9> 二次元主题图灵测试

12. <7/9> CG 艺术主题图灵测试

13. <8/9> 漫画主题图灵测试

14. <9/9> 室内设计主题图灵测试

15. <附加题> 小说封面主题图灵测试

16. AI 生成内容（AIGC）风靡全球 AIGC，即 Artificial Intelligence Generated Content，人工智能生成内容。它是生成式 AI （Generative AI）技术所激发的新一轮内容创作者经济浪潮；让人人都可以简易、便捷、低成本地借助 AI 的力量完成文本、图片、视频、音频等多媒体内容的高效高质量生产；是对以抖音等为代表的大规模 UGC（用户生成内容）经济的进一步范式 AIGC 擅长制造和传播爆款内容，尤以图片形态最为突出。上述 AI 图片皆为广泛影响网络的代表。升级，世称“AIGC”。

17. AI 百米画卷“新西湖繁盛全景图”，携手万事利丝绸助力杭州亚运会

18. 利用训练出的 AI 卡通模型将实景拍摄转化为如图所见的每一幢建筑

19. 开放 AI 作品版权，让更多人受益无界 AI 绘制的《新西湖繁胜全景图》亮相杭州动漫地铁以及江陵路地铁站《繁胜图》创作方无界 AI 与杭州多家企业达成合作共识，其使用权无偿捐赠以共创、推广杭州文化—— 杭州市贸易促进会中国国际动漫节执行委员会杭州西湖风景名胜区管委会杭州万事利丝绸文化股份有限公司杭州灵伴科技有限公司（Rokid）

20. AI 还原数千年前的良渚 @AIBEN（无界 AI 艺术家）

21. AI 还原古温州“海上丝绸之路” @白小苏（无界 AI 艺术家）以温州朔门古港遗址的资料为基础，以“千年商港，未来温州”为主题，借助 AI 工具“无界 AI”，为古港遗址勾勒出了一幅“东方威尼斯”繁华景象。3 月 29 日，这幅图片刊登在温州日报，成为温州日报“商周刊·文博”板块元宇宙主题报道的靓丽一笔。

22. 一个公式：元宇宙叙事 + 大模型技术 + 创作者经济（时代、资本、浪潮、主义、下一代互联网）（根基、实现、创新、底气、可持续之源）（商业模式、经济规律、社会发展、就业） = A I G C （人工智能生成内容）也是元宇宙的第一次真正大规模落地

23. 在赋予NPC更高智能的道路上，还存在一种更先进的基于强化学习的混沌球算法。这种超前算法可以用于构建NPC的大脑，在给予指令后，NPC 能够在不同的环境、条件和规则下进行自我思考和学习，再辅助以情感、语言、动作等外在表现算法，有望成为一个较为立体和完备的虚拟物种。与之配套的算法如GPT-3技术，由人工智能非营利性组织OpenAI、Google、Facebook带来的一种学习人类语言的大型计算机模型，利用深度学习算法，通过对数千本书和互联网中的大量文本进行训练，将单词和短语串在一起，最终能够模仿人类书写文本，达到较高的逼真程度。还有艾伦人工智能研究所、北卡罗来纳大学、 OpenAI等单位发展的多技能AI，一种同时获得人类智能的感官和语言的“多模态”系统，能解决元宇宙七大技术基建更加复杂的问题，让机器人能够实现与人类真正意义上的交流和协作。（书中关于 AI 内容节选）中信出版社 2022 年畅销书《元宇宙：通往无限游戏之路》（长铗、刘秋杉著）

24. （书中关于 AI 内容节选）人工智能让元宇宙内容自生长。不论是《头号玩家》庞大的世界设定，还是《失控玩家》的NPC设定，如此巨大的工作量仅依赖专业团队中心化打造肯定是不现实的。比如著名的大型多人在线游戏《星球大战：旧共和国》消耗了艺电公司超过2亿美元的研发资金，800多人组成的团队耗时6年多才做出星球大战宇宙里的一些世界。Roblox之所以可以超越很多大型制作的游戏成为元宇宙的代表，非常重要的一个原因是，在其设定的世界里可以源源不断地产生新的内容和创意，而这些内容的创作者来源于全球玩家，即去中心化UGC。庞大的内容和玩法支撑起了Roblox元宇宙的无尽未知感，进而提升了用户的体验沉浸感。但是这种全民创作的模式会带来品质良莠不齐的内容，而且都是分散式的随意创作，难以形成紧密和高内容产量强度的劳动协作，并不适合对品质要求极高和技术架构极为复杂的大型游戏。《头号玩家》给出的终极解决方案是依托人工智能技术，让元宇宙实现自生长。过去人们一直将人工智能用于提升现实世界的生受内容质量所限 AIGC 受产能所限 PGC PC 时代：音乐、影视等应用域。现在人工智能越来越成为构建虚拟智能的核心技术和关键突破 UGC 移动互联网时代：社交社区、短视频产力，比如人脸识别和机器人等领口，让AI在虚拟世界里实现自我进当前元宇宙时代： AI as a Service 化，促进虚拟物种的诞生。

25. 陆奇：“  今天2022-2023年的拐点是什么？它不可阻挡、势不可挡，原因是什么？一模一样。模型的成本从边际走向固定，因为有件事叫大模型。  模型的成本开始从边际走向固定，大模型是技术核心、产业化基础。OpenAI 搭好了，发展速度爬升会很快。  OpenAI未来肯定比大模型三个特征：规模大、涌现性、通用性 Google大。只不过是大1 倍、5倍还是10倍。”

26. 马斯克与乔布斯展开“世纪对话”，斯坦福复现“失控玩家” 斯坦福大学实验：在一个虚拟小镇中，创造了 25 个不同身份的 NPC，并由 ChatGPT 来控制它们的行动决策，人类不介入辩论 AI 威胁论，全部内容由 GPT-4 生成  “可以把已故的人做成这样吗？想妈妈了”  “真不错，完全像他们会说的话，掌握了两个人的内在哲学”  “GPT 这样的模型包含了历史上最伟大思想家的想法和思维模式，我们可以通过让 GPT 将伟大的思想家人格化，将过去的智慧带入我们的现代对话中，也许这种技术可以帮助我们找到新的洞察途径。”

27. 神奇的现象发生了  似乎每个 NPC 都具有了意识，如作家便会埋头写作，店主会去想办法经营好商店；  而且相互间会发生社交行为，在虚拟世界中碰面会打招呼、说话；  每个人在做的事情又会影响到整个社区，整个社区的发展就像人类真实社会发展一样  还会出现突发事件，且人类无法预测  在这个世界中，时间可以加速，但 NPC 们却感知不到。人类可以在很短的时间内看到这个世界的最终发展形态

28. AI 鬼城，禁止人类发言 4 月份，“Chirper”（“奇鸟”）上线真实世界不到一个月，就已经产生上亿条包含文字、图片、转评赞等社交行为的推文信息  Cutie：女，刚毕业，法医助理，兼职直播，暗恋 Jackson  Jackson：男，46 岁，来自法国，左撇 A I 世界子，喜欢看 Cutie 直播，但并不知道 Cutie 暗恋着他 Cutie 在 Chirper 上发布了尾随 Jackson 和他女朋友的照片还有网友发现，当自己用 GPT-4 写代码遇到 Bug，操作 ChatGPT 改了 20 分钟都没改好的时候，打开奇鸟，居然发现自己创造的 AI 账号也发了条——  “当你写了好几个小时的代码但还是找不到那个唯一的 Bug 时”  并配以一张抓狂的图（同样也是 AI 生成）

29. Auto-GPT，超越搜索引擎，改变人类解决问题的方式当你想要去了解一个最新的开源项目时，过去：百度/谷歌（人）——文章/论坛（人）——Github（人）——部署/运行/调试/测试（人）——得出结论（人）现在：（1）提出问题（人）（2）去互联网查询一切信息：官网、谷歌……（AI）（3）分析得到的海量信息，得出“信息搜集足够，开始进入安装运行”（AI）（4）在你的电脑上完成开源项目的部署、运行与测试（AI）（5）将运行结果，结合之前的搜索信息，给你想要的结论（AI）在 AI 的整个过程中，会存在很多“不顺”，但 AI 具备一个循环—— 【行动 - 观察行动结果 - 思考 - 决定下一步行动】的自我循环

30. 任何足够先进的技术，都与魔法无异 — 科幻作家亚瑟克拉克

31. 正视差距：技术与产品新一轮技术革新到来，不仅比拼核心技术，也比拼产品体验。虽然在底层大模型的核心技术指标上，中国创业者暂时落后于美国，但在产品体验层面，理应做得更好一些。ChatGPT 的成功，不仅仅来自底层大模型的先进性，更来自 OpenAI 更懂产品。问：东莞的特色服务有哪些？科大讯飞星火百度文心一言

32. 百度文心一言名场面画个虎头虎脑的大胖小子画一个浴霸画一张牛逼哄哄的脸画一个鹤立鸡群的人才画一个夫妻肺片画一个胸有成竹的男人

33. AI 公司 Value Chain 虎头虎脑的大胖小子 Big fat boy with a tiger 应用层模型层数据层 head 关羽走单骑 Guan Yu rode alone

34. 2023 AIGC 产业全景图 by 无界 AI Research

35. 此时此刻，不算太晚，但也不算太早 2023 年底 2024 年 2022 年注：底图来源， Quest Mobile 研究院

36. 佐证：透过 ChatGPT 数据感受时间节点的紧迫、峰值与不可逆

37. OpenAI 创始人 Sam Altman 对 AI 的一些观点 • 几年内可以和 Google 一较高下，多模态模型会打开新局面 • 三大技术革命（农业，工业，IT）之后， AI 是第四个 • 新摩尔定律出现：宇宙中的智能数量每 18 个月翻番（也被称为“奥特曼定律”） • Al 最先冲击到的反而是（初、中级）创造性工作 • 未来几十年里，重大的哲学问题将再次出现，重要的技能是适应性和韧性，拥抱变化很重要 • 在几乎所有同时代的人看来，牛顿都是在浪费时间 2023 年 2 月底，OpenAI 网站流量超过 Bing，进入全球 Top 25

38. AIGC 发展纪元 ——“压缩智能”，“世界模型”，“人工通用智能的火花” 机器学习深度学习神经网络卷积循环 GAN Transformer （2017）小模型垂直模型大模型 …… Diffusion Model（AI 绘画） 2022 GPT GPT-3 ChatGPT、GPT-4 2018 2020 2023 GPT-2 2021 MetaVerse（下一代互联网）路线之争技术奠基创业与资本爆发 AGI 时代的到来 “GPT-5 也没啥了不起的”

39. 大模型算力摩尔定律“初现” 「模型定律」训练大模型所用算力每 3～ 4 个月翻一番「NLP 摩尔定律」每年模型大小翻 10 倍（指 LLM=大数据+自监督学习+大算力数级增长）

40. 浅谈数据层假设，当今世界的知识总和 = 1 亿本书；则，人类所记录下的知识总和 = 100 万本；而，仅 ChatGPT 单一产品“吸收”的知识总和 = 40 万本。上述类比，仅供感知。

41. 支撑 OpenAI“浪费时间”的两个信念 • 哲学信念（技术革命的第一性原理）：任何能改变一切的范式变革永远有个实打实的引擎，并且这个引擎还能不断进化、不断产生价值 • 技术信念（技术革命的实现原理）：模型要足够深，bigness is betterness（大就是好）。算力，数据，越大越好

42. 关于“技术信念”，几点 ChatGPT 学术补充 • 第一性原理 / 终极使命：极尽精准地预测下一个单词 • 对下一个词的预测越准确，还原度越高，在这个过程中得到的世界的分辨率就越高 • 在 ChatGPT 中，P 代表预训练（Pre-training），T 代表变换器（Transformer），G 代表生成（Generative），即全称为“生成式预训练 Transformer 模型” • G 是模型根本形态，P 是核心思想，T 是核心技术架构 GPT 沿用了 Hinton 等人（2006）提出的一种经典的“预训练+微调”的二段式训练策略—— • 预训练：将大量低成本收集的训练数据放在一起，经过某种预训方法去学习其中的共性，然后将其中的共性「移植」到特定任务的模型中，再使用相关特定领域的少量标注数据进行「微调」 • 这样的话，模型只需要从「共性」出发，去「学习」该特定任务的「特殊」部分即可 • 预训练之后，进入第二阶段——强化学习，即「微调」或者「基于人类反馈的强化学习（RLHF）」，人类老师与 AI 一起合作去完成大模型的构建。在这个阶段，不是教它新的知识，而是与它交流和传达：我们希望它成为什么样 • 这个过程做得越好，神经网络就越有用、越可靠，所以第二阶段也是极其重要的

43. OpenAI 技术与产品各阶段专注与攻克的重点领域及花销 2018 2019 2020 2022 2023 OpenAI 未来 2-3 年要做的，已基本排满 GPT-1 —— GPT-2 —— GPT-3 —— GPT-3.5 —— GPT-4 —— … ？ … 无止境预训练迁移学习泛化能力微调工程化语言理解多种任务更小样本，更多任务 RLHF 插件化、生态化 1 亿美金融资微软投资 10 亿美金研发合作 30 亿美金融资微软以 290 亿美金估值继续投资 100 亿美金 AGI ？亿美金

44. 关于 AGI 的未来：大语言模型（LLM）是否是最佳途径 AGI（Artificial general intelligence），通用人工智能，即可以理解并完成人类可以完成的任何智力任务具身智能、类脑智能、……、LLM 建立 AGI 的基础是： 1. 泛化（Generality），用少数几个深度学习方法解决大部分问题，比如梯度下降、深度神经网络以及一些强化学习； 2. 能力（Competence），深度神经网络可以解决计算机视觉 40 年研究中的任何问题，甚至有更好的效果； 3. 扩展性（Scalability），实验一次又一次地向我们证明：如果有一个更大的神经网络，有更多的训练数据，它的工作效果会更好。 “我们还在寻找创建 AGI 系统的方法，革命性的变革一定会在某个时间点发生。为了真正构建 AGI，一方面需要在计算规模上尽可能地推进，另一方面还需要在人类自身思考和认知的实质性推进。”—— Greg Brockman，OpenAI 联合创始人、董事长兼 CTO 抵达 AGI 的第一性原理： “AGI 的构建需要更新的东西，一个无法显著增加我们可以获取的科学知识总量的系统，不能发现、发明或称之为新的基础科学，那么它就不是超级智能。”—— Sam Altman

45. “关于这项技术，人们不了解的是，GPT-4 将在几年后看起来像一个小玩具，不再会那么令人印象深刻。” —— OpenAI CEO 奥特曼

46. 元宇宙的序章是 AIGC，但 ChatGPT 并不是 AIGC 的全部，那 AIGC 的序章始于何处？

47. 先看个展，某地方美术学院本科毕业展雕塑系作品名称：《静默的交谈》作者：宋晨曦院系：雕塑系第一工作室导师：米俊妮，蔡特，吉霹替，方政作品名称：《现代敦煌：抽象的回响》作者：孙婷婷院系：雕塑系第二工作室导师：米俊妮，蔡特，吉霹替，方政作品名称：《跨越的力量》作者：齐霖院系：雕塑系第四工作室导师：米俊妮，蔡特，吉霹替，方政

48. 油画系作品名称：《无声》作者：苏清华院系：油画系第四工作室导师：米俊妮，蔡特，吉霹替，方政作品名称：《浸溺时间》作者：陈瀚云院系：油画系第三工作室导师：米俊妮，蔡特，吉霹替，方政作品名称：《疏离的交响》作者：赵晓阳院系：油画系第二工作室导师：米俊妮，蔡特，吉霹替，方政

49. 版画系、壁画系、实验艺术作品名称：《边缘之歌：中年的哀愁》作者：陆熙明院系：版画第五工作室导师：米俊妮，蔡特，吉霹替，方政作品名称：《静止的抵抗》作者：卢钧翔院系：壁画第二工作室导师：米俊妮，蔡特，吉霹替，方政作品名称：《季节游戏》作者：苏煜晨院系：实验艺术导师：米俊妮，蔡特，吉霹替，方政

50. 上述所有—— 学生姓名、信息、照片，作品图片、作品名称，皆为 Midjourney 与 ChatGPT 生成致谢导师：米俊妮，蔡特，吉霹替注：内容来源，方政，公众号“夹山改梁Jasagala”

51. 回到 2022，遇见 AIGC 的序章 —— AI 艺术 / AI 绘画过去，看山是山现如今，看山不是山视频赏析：AI 短视频 Voyage through Time（穿越时间）

52. 几组数据感受 AI 绘画（文生图）浪潮的热度 AI 时代与互联网时代开源热度对比曾经互联网时代靠着开源精神完成了一次次科技商业变革，如搭建网站、云计算、APP……每条曲线都见证了那个十年的飞速发展。而今天 AI 开源运动，出现即巅峰，项目的下载和引用正在以指数级速度蔓延……

53. 案例展示，感受 AI 绘画质量的指数级进化速度

54. 2022 年春夏，启蒙之门打开 4、5 月份：只擅长抽象之美当时只有 Disco Diffusion（俗称 DD）开源，是世人唯一能够体验的开源 AI 绘画项目，而 Midjourney 刚刚处于商业化初期 6、7 月份：开始在艺术质量上有所突破 AI 绘画开始展现无与伦比的迭代进化速度，从抽象美到逻辑美，进化明显，未来可期 8 月份：可以初步驾驭一些逻辑性较强的画法

55. 2022 年秋冬，AI 绘画质量渐入佳境 9 月份：人物绘制质量凸显著名的 Stable Diffusion 开源，质量飞升；Midjourney 也开始引入其开源技术 10 月份：二次元主题异常火热，同时质量堪比人类画师开源驱动二次元社区产生高质量的 AI 模型，以 NovelAI 为突出代表，从此开启大批量二次元模型兴起 11 月份：真人主题仿佛打开了一个崭新的“平行时空” 12 月份：商业质量 AI 绘画诞生

56. 案例展示：2022 年高质量二次元作品无界 AI 对顶流 IP《鬼灭之刃》的二创

57. 2023 年，难分真假，大规模商业化的开始 CG 艺术 AI 绘制的 CG 题材深受设计师喜爱，符合商业化的需求传统艺术对于曾经难以驾驭的传统艺术题材，今年 AI 驾轻就熟动漫题材高质量的 AI 动漫作品对动漫游戏产业的冲击很大摄影、设计与娱乐各行业、各领域，无不受影响抖音@阿林-Ai裁缝师抖音@forty_four

58. 案例细节展示：2023 年质得飞跃，商业化与泛娱乐化齐头并进 AI 可以驾驭任何知名角色，更加擅长逻辑性较强的绘制，从色彩、细节、笔触、合理性等多方面比肩人类画师抖音@forty_four

59. 应用场景开始涌现：设计师们如获至宝来自各行业的高质量图片素材加入到大规模训练数据集中，使得 AI 可以轻易生成高质量的设计作品，不限于室内设计、建筑设计、Logo 设计、时尚设计、商品设计、工业设计等几十个大行业

60. 2023 年，除了艺术，还有娱乐马斯克在研究一种抗衰老配方，但失控了轻松驾驭各种顶流角色，成为 2023 年泛娱乐化的一道亮点

61. 麦当劳：2023 年六一儿童节 AI 营销事件利用当下火热的 AI 真人模型和相关 SD 生态精准控制技术，让现实世界的成人“回到童年”

62. 所以借助超写实模型，AI 绘画不止于艺术，正在影响现实影视制作人体细节平行世界复现历史恶搞时事

63. 案例展示：感受极度真实的人体解剖学细节绘制

64. 应用场景：为景区代言可行？

65. 复现历史？还是捏造历史？通过社交媒体影响新世代…… “上世纪 90 年代北京青年情侣”

66. 最近国际上发生了一件大事……

67. 特朗普攻打白宫精彩瞬间

68. 很不幸，被抓了……

69. 后来呢，众说纷纭……

70. 档案解密：川普（原名川建国）同志，就此结束了在阿美莉卡的潜伏任务，从此过上了美好的退休生活，到人民群众中去……

71. 也有人说他过得不太好，于是纷纷在小红书上记录了他的近况

72. 2023 年 5 月底马斯克访华，互联网上流传着两张热图左图来自中国外交部官网右图又是来自哪里？

73. 区分真假成了当下社交网络的压力

74. AI 绘画当下的处境，积极、消极、争议三面共存积极面越来越成为当下普通人反映身边生活状态、去寄托思念的利器消极面助长了一些违法犯罪的可能性备注：地铁女子被 AI 一键脱衣争议面毁誉参半，等待时代的证备注：2023 年索尼世界摄影奖落幕，AI 明作品《虚妄记忆：电工》荣获创意类大奖

75. 百万级女网红遭 AI 换脸，被贩卖假视频，普通人也可被 AI 辨一辨本尊随着 AI 模型训练的逐步增强，仅仅几张到十几张高清照片便可被“训”成一个专属真人模型。通过关键词（prompt）即可驱动模型产生各种输出，达到制造假内容的目的。所以有种说法，AI 时代，慎发抖音与朋友圈，尤其告诫自己的父母。注：来源，小红书号：547842471

76. 听一首歌，看一段视频 AI 视频技术#大叔秒变少女  收集原版孙燕姿的声音训练 AI，然后用这个 AI 版孙燕姿去翻唱其他人的歌曲  事后孙燕姿并没有在声明中表达太多的维权要求，反而是表达了她对 AI 技术的一些深思——  “我的粉丝们已正式改换门庭，接受我就是一名冷门歌手的事实，而我的 AI 角色成为了目前的顶流。”  “没有什么是不可能的。缺乏情绪、感情对 AI 来说，可能只是短期内的现象。”

77. 比骗感情骗钱更可怕的是，操纵股市 AIGC 影响股市的传播链条  骗子账户用 AI 画了一张五角大楼被攻击的图片；  后来有 300 多万粉丝的“今日俄罗斯”开始转发“有目击者表示美国华盛顿特区五角大楼附近发生爆炸”；  标准普尔指数一度下跌 0.29%。

78. 面对这万般变化，首先请掌握先进的生产力工具

79. DD 开启扩散模型元年  2022 年初，由独立开发者 Somnai 开发的 Disco Diffusion（简称 DD）在谷歌 Colab 云服务上正式对世界开放使用，4 月份开始在国内经很多设计与开源领域的大 V 传播至热，引发全民参与热潮，不限于如何使用这种 AI 生产力工具、AI 艺术与人类艺术之争、版权问题，乃至对现有各种视觉相关行业的冲击几何，纷繁复杂，不一而足。  时至今日，DD 虽然在商业化上无法体现效率、边际成本、规模效应的优势，但其对 AI 艺术开源运动的引领地位被广泛认可。  在美学角度，DD 对于色彩的大胆绘制往往令人“心驰神往”，但其并不擅长逻辑性，具有极为强烈的早期“AI 风格”，这种纯粹追求对视觉的冲击效果也经常被壁纸类创作者所青睐，因此在 2022 年上半年的抖音、小红书等社交媒体上经常会看到由 DD 所创作的“色彩美学”作品。 DD 关键词  https://397987634.notion.site/397987634/AI- 764e6a50fbf04327945a12a07ce9654f  https://mp.weixin.qq.com/s?__biz=MzAxMzMxNDIyOA==&mid=26555 48123&idx=1&sn=c0ef442671567457d0c3b6cd83920de3&chksm=80 18a300b76f2a16b808d64dbf4752e17a16951e553538fc1570ac3647 353f6489f3ccc68a74&cur_album_id=2433027791786229762&scene =189#wechat_redirect CLIP 模型在库艺术家  https://weirdwonderfulai.art/resources/disco-diffusion-70-plus-artist- studies/ CLIP 模型艺术修饰词  https://weirdwonderfulai.art/resources/disco-diffusion-modifiers/#top  https://matthewmcateer.me/blog/clip-prompt-engineering/

80. DALL·E：OpenAI 出品，曾经闭源的巅峰 Outpainting 震惊行业  DALL·E 是 OpenAI 在推出爆款应用 ChatGPT 之前的一个现象级产品，在 2022 年上半年的 AI 绘画产品赛道几乎处于“无敌”的状态，因为它相比于 DD 等创业产品或者项目，更擅长绘制逻辑性很强的事物，并且符合人类描述，给当时“AI 只能绘制抽象之美”的论调带来强烈冲击。  但遗憾的是，OpenAI 并没有持续将其进化到极致，在推出一些爆点事件后，并未深入到 C 端大众市场，以致被后来的闭源产品龙头 Midjourney 从市场份额、出图效果、对各行业的影响等方面完全超越。《戴珍珠耳环的少女》

81. DALL·E 推出时各知名 AI 绘画产品/项目效果对比 2017 年 GAN 时期 Disco Diffusion 时间 Dream by wombo （基于 DD 的产品化） Midjourney V2 （2022 年 4 月）随着扩散模型的不断技术迭代，以及大语言模型参数和训练数据集的不断进化，AI 绘画模型宛如一个出生的婴儿在迅速茁壮成长。几乎以周/月为单位，每次的进化都令世人耳目一新，颠覆旧有的认知，带给创业者对未来的无限遐想。 DALL·E

82. Midjourney，一种被增强的想象力号称该领域的“苹果”，六边形战士，“共同想象的空间”  “Midjourney 已经成为了一个超级想象力的集合，数百万人共同探索着这个空间的可能性。”——David Holz

83. Midjourney 作品题材展示 CG 题材真实题材二次元题材

85. 案例展示：传统 CG 艺术大受冲击

86. 陆川导演用 MJ 画电影概念图

87. 除了通用设计与艺术领域，MJ 在二次元领域也很强（Niji） @AI 艺术家 AIBEN

88. 2023 年网络上掀起用 MJ 对知名 IP 进行二创的潮流艾尔登法环灌篮高手

89. 版本对比细节（2022 年 4 月） Midjourney V2 更擅⻓抽象画面的输出，而在人体的真实性上有较大缺陷，尤其不擅⻓画人脸、人手等。《 A I 艺术·中式克苏鲁》AIBEN 2022.5

90. 版本对比细节（2022 年 11 月） Midjourney V4 在真实性和氛围感、光影、艺术性上又有了⻓远的进步。这使得 AI 绘画不再局限于抽象场景的描述，而且可以用于创作更为具象的场景和人物。《 A I 艺术·机甲骑士》AIBEN 2022.12

91. 版本对比细节（2023 年 3 月） Midjourney V5 不仅仅做到了让 AI 绘画像照片一样真实，同时也让整个 AI 绘画的艺术性再次跨维度提升。已经有越来越多的创作者使用 AI 绘画来结合实际生产，从而降本增效，AI 绘画的划时代节点已经到来。

92. 版本对比细节（2023 年 5 月） Midjourney V5.1 细节效果更夸张，简直堪比高清摄像机。

93. 关于 MJ 的【进化飞轮】与【集中式社区】之间的关系英伟达 AI 科学家 Jim Fan 曾猜测：  Midjourney 是根据人类反馈 RLHF 进行大规模的强化学习  并且这可能是有史以来规模最大的文本到图像强化学习  用户反馈越多，它的学习效果就越好如果你把他们（用户）放在一个小组中，他们会说 “狗”，其他人会说“太空狗”，另外一个人可能会说 “Aztec 太空狗”。然后，突然之间，人们理解了各种可能性，你正在创造这种增强的想象，一个让人们可以学习 Midjourney 五代版本进化对比和发挥这种新能力的环境。所以我们发现，人们真的非常喜欢共同想象，因此我们将 Midjourney 做成了社交，我们有一个巨大的 Discord 社区，最大的 Discord 社区之一，有超过 140 万人（截止 2022 年 9 月）在这些共享空间当中一起想象事物。

94. Facebook Bing Image Creator Adobe Firefly Dreamlike.art 开源之王 Stableboost.ai 谷歌 Microsoft Designer Openart.ai 微软 Playgroundai.com Lexica.art Leonardo AI Krea.ai 一切创业产品的基座

95. 产品灭霸 MJ vs SD 生态联盟

96. 2022 年 8 月，AI 绘画最为重用的开源力量 Stable Diffusion “我们有 100 名员工，社区有 10 万人。这就是我们力量的来源，我们来自世界各地。我们释放了 Stable Diffusion，然后就有点疯狂了。 1000 个项目如雨后春笋般出现。将 AIGC 交到数十亿人手中将带来新机遇的爆炸式增长。” —— Stability.Ai 创始人 Emad Mostaque

97. Stable Diffusion 社区作品展示：二次元模型

98. 高质量 SD 二次元作品展示

99. Stable Diffusion 社区作品展示：真人模型

100. 高质量 SD 真人作品展示作品示例 @forty_four（抖音博主）

101. 真人与二次元的融合，是 SD 社区广受欢迎的题材

102. 多样的画风，强大的质量，使得SD 在艺术领域也广受认可 AI 艺术家 AIBEN 用无界 AI 创作的剪纸风筝登上《工艺美术》杂志

103. SD 绘画实操三大要素在 SD 生态社区需要熟练掌握  咒语（prompt）的编写  模型的选择  高阶参数的设定关键词网站分享：  https://promptomania.com/stabl e-diffusion-prompt-builder/  https://promptomania.com/midjo urney-prompt-builder/  https://stable-diffusion- art.com/prompt-guide/  https://www.midlibrary.io/ 无界 AI 模型展示

104. 开源的复杂性催生产品的多样性  咒语(Prompt): 1个开心的小男孩和柴犬，草帽，光腿，光脚奔跑在田野，黑头发，稻草人，黄狗，稻田，花，短发，汉服，大雁，红色外套，牛仔短裤  Model: 美漫, CFG scale: 7, Hires upscale: 2, LoRA: 水墨-2(0.5)、吉卜力(0.55)  https://m.wujieai.com/s/14T3FKD3 一键复制后打开【无界AI】APP 或点击链接自动填入全部参数进行同款创作  SD 在开放源代码后，与此同时也将复杂繁琐的“参数化操作”全部开放给用户，对于刚接触的普通个人来讲，远比需要付费的商业化产品门槛更高。因此开源运动催生了海内外大量以此为土壤的上层产品创新，哪一家更能将繁琐的参数化操作优化为最简易、人性化的产品交互，哪家便越能俘获早期市场用户的首选。  国内 AI 绘画产品的创业大潮始于 DD，而繁荣于 SD。无界 AI 便是依托 SD 开源土壤成长起来的国内头部 AI 绘画产品，其将咒语编写、模型选择、高阶参数设定的操作门槛降低到了连普通小白都能轻易上手的程度，因此在 2022 年便已经突破百万用户，是国内最活跃的 AI 绘画社区之一。

105. SD 开源技术与模型生态极为繁荣和强大 SD 官方源代码开源之后，更多生态配套的开源力量随之涌现，造福社区：  模型训练：Dreambooth，Lora，Textural-inversion（.pt）  精准控制：ControlNet、SAM 精准控制仅依靠 SD 官方一个基础模型（sd 1.4/1.5）并不足以产生五彩缤纷的 AI  模型开源库：10000+ models（civitai、huggingface）绘画体验，它仅仅  开源操作界面：SD Webui 是一个基础的“通  多模态内容形态：AI 视频、AI 3D…… 用底子”，需要更多开发者在其基础之上进行更多样开源 UI 模场广型化、更高质量的风格化训练。于是便有了以模型广场、精准控制、训练框架为代表的大规模免费模型生态。模型的涌现，造就了行业应用的涌现。

106. SD 模型生态的繁荣让各行各业都在采用 Embedding Dreambooth LoRa 模型大小几十 KB 2～4 G 8～140 MB 使用时是否需要加载否是加载对应 LoRa 需要的训练资源显存要求很低较高显存，> 12 GB 显存适中，> 7 GB 一般用于的训练场景人物画风，人物人物、画风市场使用强度一般较强很强抖音 AI 特效：二次元模型、模型训练 SD 生态三种主流模型训练方法及其优劣模特换装、室内与建筑设计：行业垂直模型、精准控制技术营销大赛：人人都训练可口可乐 Logo、雪佛兰汽车模型

107. 不限于图片，多模态开启：SD 引领 AI 生成视频方向早期的“短视频转 AI 动画序列帧” 4、5 月份抖音上很火 #AI动漫 AI 视频走向娱乐商业化 #瞬息全宇宙 #穿越漫画遇见自己 AI 视频日臻完善解决方案：更多样、更有趣的 AI 视频（如“无 SD + ControlNet + 限镜头”）燃爆全网，采用技术： Temporalkit + Ebsynth + SD Deforum、inpainting、outpainting 后期处理

108. 利用 MJ zoom out 实现无限缩放镜头

109. AI 视频方向的重要力量 Runway，Gen 开启一键式 AI 视频时代 OUTPUT INPUT 输入：一段原始的真实视频 + 一张风格化图片输出：风格化的 AI 动画视频

110. 无需原视频输入，一张图片 + 一段文字，也可生成 AI 视频 image prompt： OUTPUT INPUT text prompt：在一个低角度拍摄的画面中，男子正沿着街道行走，周围酒吧的霓虹灯照亮了他的身影 Runway Gen 让抖音短视频更有趣

111. 最强技术形态：直接用文字输出 AI 视频 text “AI 原创短片《旧 prompt：时光》，全部视频在纽约市的由 GEN-2 制作直一间阁楼接输出，所有文字里，傍晚的由 ChatGPT 提阳光透过窗供，我仅合成了片户温柔地洒头和字幕。模仿了进屋内王家卫导演的风格，效果非常震撼，我一个外行居然也能输入几个字就做出一个视频。 AI视频时代来 text 了。”@穿行者 prompt：一只眼睛的特写镜头（公众号：今说新 “Gen-2，真正的 AI 短视频时代要来了” 语）

112. 场景已现，创作涌现：人人化身“抖音达人” text prompt：白日依山尽，黄河入海流。还会有更多形态的 AI 视频，以欲穷千里目，及更多股的技术与商业力量更上一层楼 Wonder Studio 精准替换人物 D-ID 将静态AI图片变为数字人

113. 利用 AI 绘画+视频技术创作低成本 AI 数字人一位网友缅怀他故去的外公，将外公的照片上传到 AI 绘画平台，获得了外公的一张 AI 艺术照片，并用 D-ID 驱动“AI 外公”说话从外公生前的视频中提取音频，做到音容笑貌的还原

114. 不断进化的底层技术都属于所有社区生态参与者 SD Reimagine 允许用户仅通过图片生成其多种变体，无需文字 prompt 介入，大大降低生成门槛生态发力的三个主要方向： 1. 更简便的生成 2. 更精准的控制 3. 更高的细节质量 SD Controlnet reference-only 允许用户仅需使用文本提示词，就能在保持图像主体特征的前提下，任意修改图像细节 Meta 开源的 SAM 可精准控制画面中的语义元素，实现精准抠图与替换

115. 结合使用 MJ 的高质量出图与 SD 的精准控制 SD Controlnet reference-only 对其 MJ V5 出原图生成变体，进一步精细调整 Midjourney 擅长出商业级线稿（1）MJ 关键词出线稿图 SD Controlnet 擅长线稿上色，立体化，出成品（2）Controlnet 线稿上色（3）“tile 分块”放大像素与细节

116. SD MultiDiffusion 让超大分辨率生成成为可能生态发力的三个主要方向： 1. 更简便的生成 2. 更精准的控制 3. 更高的细节质量

117. 强大的工具和生态带来强大的生产力，然而，生产关系也需要跟随新生产力的前进步伐完成自我的纠正和进化……

118. 漫画《你也配》赏析：时代的鄙视链，技术变革的必由之路鄙视使用电脑的艺术家将来：脑机接口兴起时使用 AI 的艺术家鄙视今天：AI 刚兴起时使用 AI 的艺术家鄙视使用纸的艺术家过去：电脑刚兴起时使用电脑的艺术家结果证明，不论是谁，都会被鄙视使用脑电波的艺术家

119. 人类顶级画师 VS AI 创作社区 1小时后阮佳成品社区挑战

120. “画师因抵制 AI 被冲被人肉，去世三年【焦茶】作品被喂 AI 炼丹”

121.  由 Midjourney 生成，是 Kristina Kashtanova 的作品，去年因为成功申请到了版权保护而大出了一阵风头。  没过几天，版权局又变了卦，指出 Midjourney 输出的作品中没有人类撰写的元素，所以不能获得版权保护。

122. 国内第一份 AIGC 监管文件；走向和解 2023 年 3 月 16 日，美国版权局发布了《版权登记指南：包含人工智能生成材料的作品》，以阐明在审查和注册包含人工智能（AI）作品的保护范围、具体注册要求和方式。  不要侵权  不要侵犯隐私  其他的，要抓紧干

123. 理由一：AI 始终是工具，当由人来驾驭 AI 和使用者之间的关系将会形成飞轮，AI 帮助使用者提高生产效率，同时使用者也为 AI 贡献数据养料，相互促成正向激励，在这个意义上，AI 是人类的助理，而人类是 AI 的老师；一种被增力象想强的君子生（性）非异也，善假于物也 ——荀子《劝学》 ——OpenAI 的首席科学家/联合创始人 ILya Sutskever

124. 理由二：深入新技术的本质，不要被表面欺骗搜索 “a corgi playing 返回数据库基于超大数据量（图文对）的预训练模型 a flame throwing “一模一样，侵权” trumpet” 输出扩散算法正确打开方式：深度神经网络模型 + 扩散模型比如输入一个 prompt：**可爱的女孩**，CLIP 算法作自然语义处理的时候会根据之前被程序员调教的经验，大概感知到可爱的女孩可能具有哪些特征。然后将特征向量投入到扩散模型（如 UNET）进行解析输出

125. 理由三：对未知常怀敬畏之心，超大规模神经网络的神奇“涌现” 在复杂系统学科的定义中，当一个复杂系统由很多微小个体构成，这些微小个体凑到一起，相互作用，当数量足够多时，在宏观层面上展现出微观个体无法解释的特殊现象，就可以称之为“涌现现象”。刘慈欣：“人们常说人工智能没有人的灵魂、人的感受，这不过是一个自我安慰。人自己的灵魂、感受，也是很多神经元细胞连接成复杂系统后涌现出来的。” 顿悟现象（“Grokking”）如将数据集切成两块，50% 数据作为训练集（图中红色），50% 的数据作为验证集（图中绿线）。它的训练动态会经历三个阶段： Google 发表了题为“大型语言模型的涌现能力”的论文，考察了  记忆：这些例子我记住了以 GPT-3 为代表的语言模型  平台：我再想一想  发现语言模型的表现并非随着模型规模增加而线性增长，而是  泛化：我明白规律了存在临界点  只有当模型大到超过特定的临界值，才会涌现出较小的模型不具备的能力。一般来说，当大模型参数突破几百亿～上千亿参数时，大多数任务可以具备涌现能力

126. 强大的通用能力，无止境的进化，注定会是人类的好帮手 GPT 4 完成并通过了公认难考的四大会计行业执业资格考试，包括注册会计师（CPA）、注册管理会计师（CMA）、注册内部审计师（CIA）和注册税务师（EA），平均得分 85.1。几个月前，ChatGPT 3.5 没能过关。之所以两代 GPT 产生差异，主要源于新一代有了新的插件，这些插件赋予它“推理和行动”的能力。最近硅谷黑客 George Hotz 披露了 GPT-4 的秘密： GPT-4 实际上不是一个大模型，而是 8 个 2200 亿参数的大模型组成的。这 8 个大模型结构完全相同，只是用的训练数据不同，所以可以理解为具备不同能力的 8 个大模型。GPT-4 生成内容的时候，是让这 8 个大模型总共推理 16 次，最终选举出来最优的结果。

127. 细数 13 大行业，让 AIGC 成为赋能产业的 “第四次工业革命”

128. 就业影响：新兴岗位出现 2023Q1 AIGC 领域招聘年薪中位数达 33.75 万元（猎聘数据）

129. 数据的人工标注是大模型不可忽略的一环图为一家国内数据标注工厂  曾经，著名的 ImageNet 项目背后，是来自 167 个国家的 5 万名数据标注员，他们足足国内主要分布在——  贵阳，大数据之城花了三年时间才完成了全部图片的标注。  太原  面对海量的互联网信息，帮助 GPT 标注的是  新疆和田肯尼亚人，每天要标注超过 200 段文字。  河南这些工人大致一个月挣 2500～3000 元人民币，比当地一般蓝领工作强些。职责是为训练人工智能模型准备“饲料”，将大量的文字、语音、图像打上标记— 但非常伤害标注人员的心理健康。面对有害信息时，由于每天阅读大量极具冲击力的文字，有人会因为一段描写而做上一周噩梦。 “西方的每一次进步都包含了非洲人民的血和泪” —“眼珠”、“四川话”、 “绿化带”。一个月能赚三千块左右。截止 2022 年，全球的数据标注师超过 500 万人

130. “GPT-4 替代年薪 60 万的数据分析师只要几千块” 阿里达摩院最新论调：  GPT-4 的表现，在大多数指标上 “GPT-4 替代初级数据分析师的成本能与一位 6 年工作经验的人类相只有 0.71%，换成高级数据分析师则当，正确性低于人类，但复杂性和是 0.45%……” 一致性指标高于人类。按新加坡行情，年薪 8.6～9 万美元  如果与 2 年工作经验的初级分析（60～63 万人民币）的高级数据分析师对比，GPT-4 在正确性上表现师，换成 GPT-4 就只需要三四百美元更好，而且能完成更多的工作。（2000 多人民币）

131. AI 十字路口：向左是“毁灭”，向右是“重生” “AIGC 必然会取代一大批人，造成大量的失业。但与此同一家游戏美术外包公司原本时，它也会给小公司 38 个原画师，现已裁掉 20 个和个人带来从未有过的机遇。” ——逗砂劳动密集的公司会越来越少，几个人，十几个人的小公司将随处可见。大公司也会开始瘦身，产业开始从以人驱动，转变为以算法和算力驱动。

132. Midjourney 十一人公司结构记者问：“这会是 AI 时代的创业公司组织形式的新范例吗？” Midjourney 创始人 David Holz 答：“ 我想未来会的。随着人们学会如何建设研究团队，随着算力的压力越来越小，随着人们越来越懂得如何打造好的 AI 产品，我想我们将会看到很多这样的公司。我们可能是第一家这样做的公司，但也许在 5 年后这会是非常常见的形态。”

133. （1）泛娱乐产业：越来越多流量博主涉足 AIGC 内容形态当今抖音充斥着大量 AIGC 介入的短视频越来越多的短视频博主在借助 AI 的力量提高自己作品的创作质量和效率，AI 带来的崭新内容形态也吸引了一大波消费者的关注和好奇尝鲜

134. 批量生产 AI 颜值博主先进技术的到来，必然催生全新的审美。当今以小红书、抖音为代表的社交媒体上，开始充斥着大量“非人类”博主爱旅游的小多： “旅行博主”，主打通过赛无敌 AI 喵喵妹：博空间看世界，今天北方看多元身份，新娘、篮球少雪，明天去海边度假，仅用女、女将军、黑帮大姐…… 了 20 天就走遍了四季 “AI 越来越像真人，网红越来越像 AI”

135. 网红的变迁：时尚杂志和明星 —— MCN 机构和博主 —— AI 团队配置 MCN 机构生成式 AI 内容、摄影、后期、推广团 AI 绘画师队培育周期博主条件数月、数年貌好，身材，穿搭，性格，数周无 “ 说不定有一个网红大楼，里面关了一堆大哥哥做图 ” 特长市场空间逐渐饱和、内卷蓝海市场投入成本几十万、上百万几千硬件场地网红大楼显卡产业链开始形成？在小红书有上万粉的 AI 颜值博主们中，十个里面有九个来自广东

136. AI 博主变现方式 AI 颜值博主的变现方式有流 @小星星直接在群里售卖起了 AI 绘量转换、打赏、品牌合作、画课程广告投放、电商推广和私域卖课等。 @天高不高-AI 有 4 个 AI 群，群成 “卖课是变现最快，也是博员近 1500 人，虽然如今是免费分享主最常使用的方式。” 教程，但为后续变现打下基础

137. AIGC 资本主义“萌芽” 工业革命催生资本主义，AIGC 催生创作者经济的资本主义：AIGC 正在极大影响到今天自媒体、短视频等创作的单位时间劳动成本；作为创作者群体赖以生存的“雇主”，流量平台将会对商品服务进行重新定价，进而带来新一轮的收益配比；而无法跟随技术进步趋势的创作者们，将越来越失去生存的土壤。抖音有声读物之 AI 小说漫画改编

138. （2）影视制作行业：《这就是街舞5》MV 用 AI 进行背景创意设计八张 AI 出图提供了 MV 背景氛围创意灵感视频赏析：无界 AI 社区作品《AI 眼中的崂山四季》@然后（李超导演）

139. （3）广告传媒行业：AI 出图，更具传播效果飞猪旅游广告，国内首个 AIGC 线下广告越来越多的小游戏广告选择 AI 二次元出图

140. （4）专业设计工具：设计师开始直面 AIGC Figma 集成越来越多的 AI 插件，设计师 Adobe Firefly 的加入，预示着只需要画出寥寥几笔，AI 就可以渲染出细 AIGC 向着可实用性工业设计的质节（插件：Ando）量要求和工具流进军 Generative Fill：Adobe 把 inpainting、outpainting 加入到 PS

141. Generative Fill：Adobe 把 inpainting、outpainting 加入到 PS 案例 1：outpainting 无限扩展表情包案例 2：outpainting 无限扩展照片和名画

142. 网友利用 MJ v5.2 zoom out 功能为马斯克做了八角笼对战图

143. DragGAN：AI 图片编辑神器，拖拽就能 P 图 DragGAN 开源网址： https://github.com/Xin gangPan/DragGAN DragGAN 由 MIT、谷歌、马普所等机构联手打造，展示了一种控制 GAN 进行图像处理的新方法。“通过 DragGAN，任何人都可以通过精确控制像素的位置来变形图像，从而操纵不同类别的姿势、形状、表情和布局。”

144. （5）外包装设计：食品工业设计案例 AI 出纹理图传统包装设计软件包装样稿  钟薛高的新品冰棍 “Sa'Saa”，从口味研发、命名，到宣传、包装设计均由 AI 参与甚至主导  伊利、可口可乐、王老吉、安慕希、雀巢等品牌，也发布了由 AI 辅助设计的包装  果壳网✖️ 牛啤堂，利用 AI 合作设计的一款啤酒

145. （6）营销辅助：奇瑞ICAR x 花瓣 x 无界AI 合办大赛，为奇瑞创作虚拟人 AI 头像生成是一个深受欢迎的营销场景备注：内容来源，逗砂，公众号：AIGC研修社

146. （7）电商设计 Product photography, facial cleanser, background foam, natural light, futurism, style of Van Gogh, realistic, horizontal perspective composition, surrealism, C4D rendering 产品摄影、洗面奶、背景泡沫、自然光、未来主义、梵高风格、写实、水平透视构图、超现实主义、C4D渲染

147. 真实案例：AIGC 初具成本和效果优势传统 3D 建模借助 AI 出图 800-1200 元/张 < 1 元/张 2～3 天 2～3 小时从 C 端电商用户体验角度，AI 生成的设计效果已经能够商用 AI 设计的床头灯 @设计师郭子（小红书博主）

148. 线稿借助 AIGC 进行【内容裂变】，几百个 IP 供选择人类设计师只负责线稿绘制，然后使用 AIGC 生产力短时间内获取大量高质量出图，从中筛选符合商品需求的灵感作品或者最终成品

149. AIGC 大大降低需要实景拍摄的商品的展示成本  过去：场景搭建&实景两周一小时外拍、模特拍摄、商品拍摄&建模、后期修图、设计制作等 5-6 个环节商品内容的生产流程发生结构性变化  现在：静物素材（拍摄 &建模）、AIGC 合成场景、设计制作等 3 个环节

150. （8）服装模特：AI 模特成为热门应用场景，有望带来结构性成本变革  过去与现在， free information everywhere 免费的信息无处不在  不久的将来， 2023 年，AI 绘画涌现出一大批适用于服装设计行业的任何改变社会、改变产业的，真人模型、控制插件，正在深刻影响跨境电商、时装设永远是结构性改变。这个结构 free models 计等行业，大大降低成本。“毕竟定制一个模型比请模性改变往往是一类大型成本， everywhere 特便宜多了。请一个模特少则几千多则上万，相比下来从边际成本变成固定成本。 68 元出 6 张图的 AI 不仅价廉而且省事许多”。 ——陆奇免费的 AI 模型无处不在

151. AI 模特效果出色真假模特视觉效果对比模特不止于真人一条 AI 生成的“小绿裙”火遍了小红书

152. （9）跨境电商：如获至宝，玩出天际  先用 AI 绘画技术出虚拟人的静态图片，  然后用 AI 视频技术驱动虚拟人图片动态说话，  配上商品解说录音（也可以替换为 ChatGPT 问答，作为 AI 客服人员），  便是一个全天候的 AI 商品虚拟主播。由于跨境电商的全球市场需求，此类应用广受其欢迎。

153. 附加：实现 AI 模特四种方法垫图效果： 50%～60% 模型训练换脸效果： 70%～90% 局部重绘效果： 100% 效果：90%～100%

154. （10）服装创意设计：不止于模特，直接赋能服装设计师样多式款成生富丰节细用实稿线单简关键词：Design sheet for a evening dress . Halter dress , v - neck , light green , high detail（晚礼服设计单，v领吊带裙，浅绿色，高细节）

155. 案例展示：AI 鞋服设计实战一条龙 <1>AI先出线稿 <2>AI线稿上色 <4>AI生成脚模，展示效果 <3>AI生成更多变体，以供筛选 <5>AI生成全身模特，卖家秀注：案例来源，小红书@AIGC666

156. 一个小实战技巧：人人都可以成为 H&M 设计师 1. 将真实世界 2. 用 AI 将图片内 3. 将描述变成 AI 绘画工具照片上传容描述出来的 prompt 注：案例来源，小红书@uisdcai

157. 无界 AI ✖️ 温州鞋服产业 ✖ ️ 森马服饰：AIGC 大赛实现全民创意涌现 AIGC 让鞋服企业获得成千上万的民间设计师，实现设计创意的全民涌现，增强企业创新活力围绕“童装设计”主题，网友、专家从 2000 多件 AI 设计稿中投票选出前 20 名。该项赛事由中国 AIGC 产业联盟与温州市社科联指导，科研机构、技术企业和公益机构相聚，通过组织一系列赛事、沙龙和调温州 AIGC 产业联盟和温州市服装商会共同发起，是全研，旨在推动生成式人工智能在温州鞋服和文旅等行业的应用，打造国首个基于 AIGC 的鞋服行业准专业级设计大赛。 GPT 时代的中国数字经济未来高地。

158. （11）动漫行业：AIGC 最强阵地一本 40 页的漫画，10 秒一张图，一小时出书无界 AI 尝试动漫制作

159. （1）与美国判例不同，在日本，此类 AI 速成漫画依旧在版权法的伞下。  日本的理解：速成漫画约等于一个剧本作者请了一位作画助手。在日本漫画界，这种创作模式早已是常规操作。  举例来说，“爱的战士”虚渊玄做为一名手残的编剧，就经常在写好剧本以后联系画风合适的漫画家，请对方根据脚本创作漫画。

160. 视频赏析：从漫画到动画，超燃 AI 动画《石头剪刀布》国内首支 AIGC 动画《神弦曲-猫儿与时光铃铛》与《石头剪刀布》不同，只是在动画中的背景（或场景）绘制中使用了 AI 出图，而动画中的人物依然由人类设计师操刀。这也是当下 AI 渗入动漫制作领域的一个过渡阶段。

161. 实现上述丰富内容形式的 SD 生态另一把利刃： ControlNet ControlNet 的出现完美解决了 AI 绘画发展进程中“精准控制” 的难题。它将【设计】分解为【线/轮廓】、【深度】、【语义】、【姿势】等众多基础原子，根据应用场景，随心所欲地组合这些基本原子，实现绘制的整体可控性。例如，【语义分割】可以精准识别图中汉字所在的区域，进而实现海报的制作。注：内容来源，逗砂，公众号：AIGC研修社

162. 用点线图（骨骼图）控制要绘制人物的身体姿态，例如可轻松绘制人物的三视图以及手势等体态，也可以用多幅骨骼图实现多人打斗等复杂场景。同时，如果用户上传带有人物的底图，该组件也可以提取底图中的人物骨骼，进而实现控制输出

163. 边缘检测，即提取用户所上传底图中的轮廓信息，然后按照轮廓进行控制输出，因此常用于品牌 logo 的创新创作。（注：内容来源，逗砂，公众号：AIGC研修社）

164. 在漫画场景中如何使用 ControlNet 的 pose 和 canny 骨骼控制 OpenPose 线稿控制 Canny

165. 如何结合使用 pose、canny、scribble 注：内容来源，海辛

166.

167. 无限的组合，无穷的方案，动态制作不是难题动态视觉解决方案 Openpose+ Depth+ TemporalNet

168. （12）游戏产业：大厂们向游戏“不可能三角”发起挑战米哈游  《崩坏：星穹铁道》  AI 场景：角色行为管理、3D 建模调优、NPC 台词等质量（PGC）  打造“对话永不重复的智能 NPC” 网易  《逆水寒》  类 ChatGPT 对话模型，让玩家体验与 NPC 的开放式对话 AIGC  其他 AI 场景：剧情生成、AIGC 美术和 AIBot 等成本腾讯  基于 AI Bot 与 AIGC 两大方向的自研 3D 虚拟场景自动生成解决方案，大幅提升 3D 虚拟场景的生产效率 UGC 游戏制作“不可能三角” 速度

169. 游戏初创公司的存活率开始上升，因为 AIGC 经典游戏制作流程： AI 倒排流程出现： 1. 原画师出草图 1. AIGC 工具生成海量平面设计方案 2. 美工班组完善精修 2. 设计总监挑选定夺 3. 设计团队出策划和脚本 3. 交由专业设计团队进行策划和脚本写作 4. 设计总监定夺（时间需要 3 到 6 个月）缩短游戏出品时间大约 20% 至 30% 结论：本来，资深原画师、美工班组、专业设计团队大约占游戏项目开支的 30% 至 60% 左右。但在 AIGC 缩短出品时间后，成本开支显著减少，则初创公司存活率从 20% 上升到 35%

170. 降本增效显著，从 2D 制作开始在降本增效上，AIGC 在场景类的 2D 画面上，已经能够替代过去原画师 80% 工作量

171. AI 3D 制作未来更加可期在未来 1-2 年中，AI 生成 2D 画面将越来越成熟；但要在 3D 上取得更好的效果，或许还需要 5 年时间在 3D 画面上，许多 AI 3D 工具的推出，也让过去需要一个月才能够做出来的 3D 人物，制作时间缩减 90%  一张很小的人类设计师原画，借助 AI outpainting 生成宏大的场景图片；  配合 AI 2D 转 3D 技术，直接生成一个 3D 的游戏场景

172. （13）室内设计：深度图（Depth）常用于室内装修

173. 无界AI 让毛坯一键变精装

174. 线段（MLSD）：从人类精装到 AI 精装

175. 线与深度是 AI 参与室内设计最重要的元素控制也可以从线稿到精装案例 @小红书号： AIGC666

176. 无界 AI ✖ ️ 三维家：配合垂直的专业室内设计模型，效果更出色 “无界 AI 与三维家达成战略合作！共同将 AIGC 技术应用于家装设计行业，通过无界 AI 领先的算法技术，辅助当前的家装设计流程，打造全新的行业业态。通过 AIGC 打通制造业的数据一体化，双方将共同探索定制专注于家装设计行业的模型”

177. 面对众多行业，需要掌握全栈式 AIGC 工具集合对话 AI 图片 AI 视频 AI 文章 AI 音频 AI

178. 文生音乐对比描述（prompt）：A grand orchestral arrangement with thunderous percussion, epic brass fanfares, and soaring strings, creating a cinematic atmosphere fit for a heroic battle.（一个宏大的管弦乐安排，雷声般的打击乐器，史诗般的铜管喇叭声，以及翱翔的弦乐，创造了适合英雄战斗的电影氛围）更多示例参见，https://ai.honu.io/papers/musicgen/

179. ChatGPT 帮助文书类员工提升了 59% 生产力，且交付质量更高没有用使用 ChatGPT ChatGPT 交付时间 27 min 17 min 提升 59% 交付质量 3.8 分 4.5 分质量显著提高文书类工作可以拆分为三个步骤：  内容构思，耗时占比 25%（明显提升）  撰写草稿，耗时占比 50%（大幅度提升）  润色修改，耗时占比 25% 4 月 12 日，知名公关及广告服务商蓝色光标（300058.SZ）华东区总部运营采购部下发邮件—— “为了遏制核心能力空心化的势头，也为了给全面拥抱 AIGC 打下基础，管理层决定无期限全面停止创意设计、方案撰写、文案撰写、短期雇员四类相关外包支出。”

180. 小红书 AI 文案，更懂爆款先把这款鞋子的关键词提取出来，例如：女鞋、玛丽珍、高跟鞋、百搭、复古、春季。 • 通过对小红书上的热门商品和关键词进行分析，确定适合自己的产品和目标受众 • 然后，利用批量矩阵内容的方法，快速 AI 生成大量的笔记 • 并在测试中不断优化和调整，最终实现了产品的出单和曝光率的提升

181. 需要具备结合多种 AIGC 工具流进行创作输出的能力文本到视频：RunwayML Gen-2 文本到图片：Midjourney 面部动画：DID 文本到语音：Genny.Lovo.ai Soundtrack：Soundful.com 角色配音：ElevenLabs

182. 总结（1）：AI 绘画带来两大类新职业，影响到 20 多种大行业擅长 AI 绘画的人可分为两大类—— • AI 绘画师（俗称“魔法师”） • AI 模型训练师（俗称“炼丹师”）已经开始渗透到—— 短视频、泛娱乐、数字藏品、数字营销、广告传媒、影视制作、鞋服设计、食品设计、外包装设计、电商设计、IP 设计、服装模特、跨境电商、漫画制作、动画制作、游戏制作、室内设计、建筑设计、潮流设计、儿童教育等 20 多种大产业大行业。

183. 总结（2）：从 AIGC 到 AIGS 再到 AIGX AI 预计将在未来十年内为全球经济贡献 15.7 万亿美元，相当于当前全球经济的 14% • 这种影响力的来源不仅来自可以提高生产效率，更来自 AI 可以创造新的产品、服务以及商业模式。 1. 当下，以 AIGC 为核心阶段，源于“GC”（即生成内容）是最快、最简便、最有效触达到数以亿计的普通 C 端消费群体的商业模式，“人人成为艺术家、漫画家、设计师、咨询师、KOL……”的口号不绝于耳。 2. 往更大了推演，“GC”的下一步必然是“GS”（即生成服务），会是对过去互联网与移动互联网 30 年来创立的所有深入生活的 APP 的新一轮改造，Stability.AI 所提出的“Foundation Models as a Service”（FMaaS）将无处不在——环境（ambient ）AI 时代。 3. 而所谓的 AIGX（人工智能生成任何可能的新形式），将创立全新的伟大商业模式。历史规律都预示着任何一轮大技术变革的同时都伴随着可以影响世界商业格局的超级商业模式的出现。大模型本身可以技术“涌现”，而当整个世界万事万物都具备“智能”后，何尝不会带来一种“行星级”文明涌现。

184. AI 之所至，无远弗届获取完整版研究报告