AIGC之AI绘画行业发展研究报告2023

如果无法正常显示,请先停止浏览器的去广告插件。
分享至:
1. 无 界 A I 研 究、用 户 运 营 与 高 校 业 务 团 队 2 0 2 3 年 7 月
2. 目录 (上) 艺术篇 01 AI 绘画行业数据 02 各阶段 AI 艺术质量展示与进化 测试篇 01 各行业案例图灵测试 02 无界 AI 行业案例展示 技术篇 01 AIGC 诞生的历史脉络 02 大模型技术驱动下的落地案例 03 AIGC 产业全景图 04 GPT 的发展、技术原理与未来 05 什么是 AGI 03 顶级质量飞轮:商业化与泛娱乐化并进 04 真实世界模型:元宇宙照进平行世界 05 积极、消极、争议三面共存 工具篇 01 Disco Diffusion 与 DALL·E 介绍与操作 02 详解 Midjourney 03 开源力量 Stable Diffusion 全解析 • 咒语实操 • 模型训练 • 生成视频 • 精准控制技术 04 工具流:如何结合与统一 MJ 与 SD
3. 目录 (下) 产业篇 01 就业问题 02 AI 时代创业公司结构 03 泛娱乐产业 哲理篇 • 自媒体与 KOL • AIGC 资本主义出现 04 大产业 01 版权问题,社区的二元对立 02 法律判决,国家监管 03 从抵制到和解的必由之路 04 深入技术变革的哲学本质 • 影视制作 • 广告传媒 • 设计工具 • 食品包装 • 营销辅助 • 电商展示设计与跨境电商 • 服装模特与时尚设计 • 工具论 • 扩散模型技术原理 • ControlNet 实操:动漫制作与游戏产业 • 涌现与顿悟 • 室内设计 • 大模型的通用性 05 不止 AI 绘画:掌握全栈式 AIGC 工具流 06 结论与展望
4. 报告提纲  通过图灵测试,成为 AI “驾驭派”  窥探 AIGC 的第一性原理,从根本上预见无限的未来  追溯 AI 艺术的历史发展,感受进化的力量  掌握顶级 AI 绘画工具,拥抱变化,选择和解  AIGC 已经具备大范围赋能产业设计的可行性
5. 进入图灵测试…… 哪些人类,哪些 AI ?
6. <1/9> 服装时尚主题图灵测试
7. <2/9> 摄影主题图灵测试
8. <3/9> 电影制作主题图灵测试
9. <4/9> 中国山水画主题图灵测试
10. <5/9> 中国工笔画主题图灵测试
11. <6/9> 二次元主题图灵测试
12. <7/9> CG 艺术主题图灵测试
13. <8/9> 漫画主题图灵测试
14. <9/9> 室内设计主题图灵测试
15. <附加题> 小说封面主题图灵测试
16. AI 生成内容(AIGC)风靡全球 AIGC,即 Artificial Intelligence Generated Content,人工智能生成内 容。它是生成式 AI (Generative AI)技术所激 发的新一轮内容创作者经济 浪潮;让人人都可以简易、 便捷、低成本地借助 AI 的力 量完成文本、图片、视频、 音频等多媒体内容的高效高 质量生产;是对以抖音等为 代表的大规模 UGC(用户生 成内容)经济的进一步范式 AIGC 擅长制造和传播爆款内容,尤以图片形态最为突出。上述 AI 图片皆为广泛影响网络的代表。 升级,世称“AIGC”。
17. AI 百米画卷“新西湖繁盛全景图”,携手万事利丝绸助力杭州亚运会
18. 利用训练出的 AI 卡通模型将实景拍摄转化为如图所见的每一幢建筑
19. 开放 AI 作品版权,让更多人受益 无界 AI 绘制的《新 西湖繁胜全景图》 亮相杭州动漫地铁 以及江陵路地铁站 《繁胜图》创作方无界 AI 与杭州多家 企业达成合作共识,其使用权无偿捐赠 以共创、推广杭州文化—— 杭州市贸易促进会 中国国际动漫节执行委员会 杭州西湖风景名胜区管委会 杭州万事利丝绸文化股份有限公司 杭州灵伴科技有限公司(Rokid)
20. AI 还原数千年前的良渚 @AIBEN(无界 AI 艺术家)
21. AI 还原古温州“海上丝绸之路” @白小苏(无界 AI 艺术家) 以温州朔门古港遗址的资 料为基础,以“千年商 港,未来温州”为主题, 借助 AI 工具“无界 AI”,为古港遗址勾勒出 了一幅“东方威尼斯”繁 华景象。3 月 29 日,这 幅图片刊登在温州日报, 成为温州日报“商周 刊·文博”板块元宇宙主 题报道的靓丽一笔。
22. 一个公式: 元宇宙 叙事 + 大模型 技术 + 创作者 经济 (时代、资本、浪潮、主义、下一代互联网) (根基、实现、创新、底气、可持续之源) (商业模式、经济规律、社会发展、就业) = A I G C (人工智能生成内容) 也是元宇宙的第一次真正大规模落地
23. 在赋予NPC更高智能的道路上,还存在一种更先 进的基于强化学习的混沌球算法。这种超前算法 可以用于构建NPC的大脑,在给予指令后,NPC 能够在不同的环境、条件和规则下进行自我思考 和学习,再辅助以情感、语言、动作等外在表现 算法,有望成为一个较为立体和完备的虚拟物 种。与之配套的算法如GPT-3技术,由人工智能 非营利性组织OpenAI、Google、Facebook带来 的一种学习人类语言的大型计算机模型,利用深 度学习算法,通过对数千本书和互联网中的大量 文本进行训练,将单词和短语串在一起,最终能 够模仿人类书写文本,达到较高的逼真程度。还 有艾伦人工智能研究所、北卡罗来纳大学、 OpenAI等单位发展的多技能AI,一种同时获得人 类智能的感官和语言的“多模态”系统,能解决 元宇宙七大技术基建 更加复杂的问题,让机器人能够实现与人类真正 意义上的交流和协作。(书中关于 AI 内容节选) 中信出版社 2022 年畅销书 《元宇宙:通往无限游戏之 路》(长铗、刘秋杉著)
24. (书中关于 AI 内容节选)人工智能让元宇宙内容自生长。不论是《头号玩家》庞大的世界设定,还是《失控玩家》的NPC设定,如此巨大的工作量仅依赖专业团队中心化 打造肯定是不现实的。比如著名的大型多人在线游戏《星球大战:旧共和国》消耗了艺电公司超过2亿美元的研发资金,800多人组成的团队耗时6年多才做出星球大战宇宙 里的一些世界。Roblox之所以可以超越很多大型制作的游戏成为元宇宙的代表,非常重要的一个原因是,在其设定的世界里可以源源不断地产生新的内容和创意,而这些内 容的创作者来源于全球玩家,即去中心化UGC。庞大的内容和玩法支撑起了Roblox元宇宙的无尽未知感,进而提升了用户的体验沉浸感。 但是这种全民创作的模式会带来品 质良莠不齐的内容,而且都是分散 式的随意创作,难以形成紧密和高 内 容 产 量 强度的劳动协作,并不适合对品质 要求极高和技术架构极为复杂的大 型游戏。《头号玩家》给出的终极 解决方案是依托人工智能技术,让 元宇宙实现自生长。过去人们一直 将人工智能用于提升现实世界的生 受内容质量所限 AIGC 受产能所限 PGC PC 时代: 音乐、影视等应用 域。现在人工智能越来越成为构建 虚拟智能的核心技术和关键突破 UGC 移动互联网时代: 社交社区、短视频 产力,比如人脸识别和机器人等领 口,让AI在虚拟世界里实现自我进 当前 元宇宙时代: AI as a Service 化,促进虚拟物种的诞生。
25. 陆奇:“  今天2022-2023年的拐点 是什么?它不可阻挡、势 不可挡,原因是什么?一 模一样。模型的成本从边 际走向固定,因为有件事 叫大模型。  模型的成本开始从边际走 向固定,大模型是技术核 心、产业化基础。OpenAI 搭好了,发展速度爬升会 很快。  OpenAI未来肯定比 大模型三个特征: 规模大、涌现性、通用性 Google大。只不过是大1 倍、5倍还是10倍。”
26. 马斯克与乔布斯展开“世纪对话”,斯坦福复现“失控玩家” 斯坦福大学实验: 在一个虚拟小镇中,创造了 25 个不同身份的 NPC,并 由 ChatGPT 来控制它们的行动决策,人类不介入 辩论 AI 威胁论,全部内容由 GPT-4 生成  “可以把已故的人做成这样吗?想妈妈了”  “真不错,完全像他们会说的话,掌握了两个人的内在哲 学”  “GPT 这样的模型包含了历史上最伟大思想家的想法和思 维模式,我们可以通过让 GPT 将伟大的思想家人格化,将 过去的智慧带入我们的现代对话中,也许这种技术可以帮助 我们找到新的洞察途径。”
27. 神奇的现象发生了  似乎每个 NPC 都具有了意识,如作家便会埋头写作,店主会去想办 法经营好商店;  而且相互间会发生社交行为,在虚拟世界中碰面会打招呼、说话;  每个人在做的事情又会影响到整个社区,整个社区的发展就像人类真 实社会发展一样  还会出现突发事件,且人类无法预测  在这个世界中,时间可以加速,但 NPC 们却感知 不到。人类可以在很短的时间内看到这个世界的最 终发展形态
28. AI 鬼城,禁止人类发言 4 月份,“Chirper”(“奇鸟”)上线 真 实 世 界 不到一个月,就已经产生上亿条包含文 字、图片、转评赞等社交行为的推文信息  Cutie:女,刚毕业,法医助理,兼职直 播,暗恋 Jackson  Jackson:男,46 岁,来自法国,左撇 A I 世 界 子,喜欢看 Cutie 直播,但并不知道 Cutie 暗恋着他 Cutie 在 Chirper 上发布了尾随 Jackson 和他女朋友的照片 还有网友发现,当自己用 GPT-4 写代码遇到 Bug,操作 ChatGPT 改了 20 分钟都没改好 的时候,打开奇鸟,居然发现自己创造的 AI 账号也发了条——  “当你写了好几个小时的代码但还是找不到那个唯一的 Bug 时”  并配以一张抓狂的图(同样也是 AI 生成)
29. Auto-GPT,超越搜索引擎,改变人类解决问题的方式 当你想要去了解一个最新的开源项目时, 过去: 百度/谷歌(人)——文章/论坛(人)——Github(人)——部署/运行/调试/测试 (人)——得出结论(人) 现在: (1)提出问题(人) (2)去互联网查询一切信息:官网、谷歌……(AI) (3)分析得到的海量信息,得出“信息搜集足够,开始进入安装运行”(AI) (4)在你的电脑上完成开源项目的部署、运行与测试(AI) (5)将运行结果,结合之前的搜索信息,给你想要的结论(AI) 在 AI 的整个过程中,会存在很多“不顺”,但 AI 具备一个循环—— 【行动 - 观察行动结果 - 思考 - 决定下一步行动】的自我循环
30. 任何足够先进的技术,都与魔法无异 — 科幻作家 亚瑟克拉克
31. 正视差距:技术与产品 新一轮技术革新到来,不仅比拼核心技术,也比拼产品体验。虽然 在底层大模型的核心技术指标上,中国创业者暂时落后于美国,但 在产品体验层面,理应做得更好一些。ChatGPT 的成功,不仅仅来 自底层大模型的先进性,更来自 OpenAI 更懂产品。 问:东莞的特色服务有哪些? 科大讯飞星火 百度文心一言
32. 百度文心一言名场面 画个虎头虎脑的大胖小子 画一个浴霸 画一张牛逼哄哄的脸 画一个鹤立鸡群的人才 画一个夫妻肺片 画一个胸有成竹的男人
33. AI 公司 Value Chain 虎头虎脑的大胖小子 Big fat boy with a tiger 应用层 模型层 数据层 head 关羽走单骑 Guan Yu rode alone
34. 2023 AIGC 产业全景图 by 无界 AI Research
35. 此时此刻,不算太晚,但也不算太早 2023 年底 2024 年 2022 年 注:底图来源, Quest Mobile 研究院
36. 佐证:透过 ChatGPT 数据感受时间节点的紧迫、峰值与不可逆
37. OpenAI 创始人 Sam Altman 对 AI 的一些观点 • 几年内可以和 Google 一较高下,多模态模型会打开新局面 • 三大技术革命(农业,工业,IT)之后, AI 是第四个 • 新摩尔定律出现:宇宙中的智能数量每 18 个月翻番(也被称 为“奥特曼定律”) • Al 最先冲击到的反而是(初、中级)创造性工作 • 未来几十年里,重大的哲学问题将再次出现,重要的技能是适 应性和韧性,拥抱变化很重要 • 在几乎所有同时代的人看来,牛顿都是在浪费时间 2023 年 2 月底,OpenAI 网站流量超过 Bing,进入全球 Top 25
38. AIGC 发展纪元 ——“压缩智能”,“世界模型”,“人工通用智能的火花” 机器学习 深度学习 神经网络 卷积 循环 GAN Transformer (2017) 小模型 垂直模型 大模型 …… Diffusion Model(AI 绘画) 2022 GPT GPT-3 ChatGPT、GPT-4 2018 2020 2023 GPT-2 2021 MetaVerse(下一代互联网) 路线之争 技术奠基 创业与资本爆发 AGI 时代的到来 “GPT-5 也没啥了不起的”
39. 大模型算力摩尔定律“初现” 「模型定律」 训练大模型所用算力每 3~ 4 个月翻一番 「NLP 摩尔定律」 每年模型大小翻 10 倍(指 LLM=大数据+自监督学习+大算力 数级增长)
40. 浅谈数据层 假设, 当今世界的知识总和 = 1 亿本书; 则,人类所记录下的知识总和 = 100 万本; 而,仅 ChatGPT 单一产品“吸收”的知识总和 = 40 万本。 上述类比,仅供感知。
41. 支撑 OpenAI“浪费时间”的两个信念 • 哲学信念(技术革命的第一性原理): 任何能改变一切的范式变革永远有个实打实的引擎, 并且这个引擎还能不断进化、不断产生价值 • 技术信念(技术革命的实现原理): 模型要足够深,bigness is betterness(大就是好)。 算力,数据,越大越好
42. 关于“技术信念”,几点 ChatGPT 学术补充 • 第一性原理 / 终极使命:极尽精准地预测下一个单词 • 对下一个词的预测越准确,还原度越高,在这个过程中得到的世界的分辨率就越高 • 在 ChatGPT 中,P 代表预训练(Pre-training),T 代表变换器(Transformer),G 代表生成 (Generative),即全称为“生成式预训练 Transformer 模型” • G 是模型根本形态,P 是核心思想,T 是核心技术架构 GPT 沿用了 Hinton 等人(2006)提出的一种经典的“预训练+微调”的二段式训练策略—— • 预训练:将大量低成本收集的训练数据放在一起,经过某种预训方法去学习其中的共性,然后将其中的共性「移 植」到特定任务的模型中,再使用相关特定领域的少量标注数据进行「微调」 • 这样的话,模型只需要从「共性」出发,去「学习」该特定任务的「特殊」部分即可 • 预训练之后,进入第二阶段——强化学习,即「微调」或者「基于人类反馈的强化学习(RLHF)」,人类老师与 AI 一起合作去完成大模型的构建。在这个阶段,不是教它新的知识,而是与它交流和传达:我们希望它成为什么样 • 这个过程做得越好,神经网络就越有用、越可靠,所以第二阶段也是极其重要的
43. OpenAI 技术与产品各阶段专注与攻克的重点领域及花销 2018 2019 2020 2022 2023 OpenAI 未来 2-3 年 要做的,已基本排满 GPT-1 —— GPT-2 —— GPT-3 —— GPT-3.5 —— GPT-4 —— … ? … 无止境 预训练 迁移学习 泛化能力 微调 工程化 语言理解 多种任务 更小样本,更多任务 RLHF 插件化、生态化 1 亿美金融资 微软投资 10 亿 美金研发合作 30 亿美金融资 微软以 290 亿美金估值 继续投资 100 亿美金 AGI ? 亿美金
44. 关于 AGI 的未来:大语言模型(LLM)是否是最佳途径 AGI(Artificial general intelligence),通用人工智能,即可以理解并完成人类可以完成的任何智力任务 具身智能、类脑智能、……、LLM 建立 AGI 的基础是: 1. 泛化(Generality),用少数几个深度学习方法解决大部分问题,比如梯度下降、深度神经网络以及一些强化学习; 2. 能力(Competence),深度神经网络可以解决计算机视觉 40 年研究中的任何问题,甚至有更好的效果; 3. 扩展性(Scalability),实验一次又一次地向我们证明:如果有一个更大的神经网络,有更多的训练数据,它的工作效果会更好。 “我们还在寻找创建 AGI 系统的方法,革命性的变革一定会在某个时间点发生。为了真正构建 AGI,一方面需要在计算规模上尽可能地 推进,另一方面还需要在人类自身思考和认知的实质性推进。”—— Greg Brockman,OpenAI 联合创始人、董事长兼 CTO 抵达 AGI 的第一性原理: “AGI 的构建需要更新的东西,一个无法显著增加我们可以获取的科学知识总量的系统,不能发现、发明或称之为新的基础科 学,那么它就不是超级智能。”—— Sam Altman
45. “关于这项技术,人们不了解的是,GPT-4 将在几年后看起来像一个小 玩具,不再会那么令人印象深刻。” —— OpenAI CEO 奥特曼
46. 元宇宙的序章是 AIGC, 但 ChatGPT 并不是 AIGC 的全部, 那 AIGC 的序章始于何处?
47. 先看个展,某地方美术学院本科毕业展 雕塑系 作品名称:《静默的交谈》 作者:宋晨曦 院系:雕塑系 第一工作室 导师:米俊妮,蔡特,吉霹 替,方政 作品名称:《现代敦煌:抽象 的回响》 作者:孙婷婷 院系:雕塑系 第二工作室 导师:米俊妮,蔡特,吉霹 替,方政 作品名称:《跨越的力量》 作者:齐霖 院系:雕塑系 第四工作室 导师:米俊妮,蔡特,吉霹 替,方政
48. 油画系 作品名称:《无声》 作者:苏清华 院系:油画系 第四工作室 导师:米俊妮,蔡特,吉 霹替,方政 作品名称:《浸溺时间》 作者:陈瀚云 院系:油画系 第三工作室 导师:米俊妮,蔡特,吉霹 替,方政 作品名称:《疏离的交响》 作者:赵晓阳 院系:油画系 第二工作室 导师:米俊妮,蔡特,吉霹 替,方政
49. 版画系、壁画系、实验艺术 作品名称:《边缘之歌: 中年的哀愁》 作者:陆熙明 院系:版画 第五工作室 导师:米俊妮,蔡特,吉 霹替,方政 作品名称:《静止的抵抗》 作者:卢钧翔 院系:壁画 第二工作室 导师:米俊妮,蔡特,吉霹 替,方政 作品名称:《季节游戏》 作者:苏煜晨 院系:实验艺术 导师:米俊妮,蔡特,吉霹替,方政
50. 上述所有—— 学生姓名、信息、照片, 作品图片、作品名称, 皆为 Midjourney 与 ChatGPT 生成 致谢导师:米俊妮,蔡特,吉霹替 注:内容来源,方政,公众号“夹山改梁Jasagala”
51. 回到 2022,遇见 AIGC 的序章 —— AI 艺术 / AI 绘画 过去,看山是山 现如今,看山不是山 视频赏析:AI 短视频 Voyage through Time(穿越时间)
52. 几组数据感受 AI 绘画(文生图)浪潮的热度 AI 时代与互联网时代开源热度对比 曾经互联网时代靠着开源精神完成了一次次科技商业变革,如搭建网站、云计 算、APP……每条曲线都见证了那个十年的飞速发展。而今天 AI 开源运动,出 现即巅峰,项目的下载和引用正在以指数级速度蔓延……
53. 案例展示,感受 AI 绘画质量的 指数级进化速度
54. 2022 年春夏,启蒙之门打开 4、5 月份:只擅长抽象之美 当时只有 Disco Diffusion(俗称 DD)开 源,是世人唯一能够体验的开源 AI 绘画项 目,而 Midjourney 刚刚处于商业化初期 6、7 月份:开始在艺术质量 上有所突破 AI 绘画开始展现无与伦比的迭代进化速 度,从抽象美到逻辑美,进化明显,未来 可期 8 月份:可以初步驾驭一些 逻辑性较强的画法
55. 2022 年秋冬,AI 绘画质量渐入佳境 9 月份: 人物绘制质量凸显 著名的 Stable Diffusion 开源,质量飞 升;Midjourney 也开始引入其开源技术 10 月份: 二次元主题异常火 热,同时质量堪比人类画师 开源驱动二次元社区产生高质量的 AI 模 型,以 NovelAI 为突出代表,从此开启大 批量二次元模型兴起 11 月份: 真人主题仿佛打开了 一个崭新的“平行时空” 12 月份: 商业质量 AI 绘画诞生
56. 案例展示:2022 年高质量二次元作品 无界 AI 对顶流 IP《鬼灭之刃》的二创
57. 2023 年,难分真假,大规模商业化的开始 CG 艺术 AI 绘制的 CG 题材深受设计师喜 爱,符合商业化的需求 传统艺术 对于曾经难以驾驭的传统艺术题 材,今年 AI 驾轻就熟 动漫题材 高质量的 AI 动漫作品对动漫游戏 产业的冲击很大 摄影、设计与娱乐 各行业、各领域,无不受影响 抖音@阿林-Ai裁缝师 抖音@forty_four
58. 案例细节展示:2023 年质得飞跃,商业化与泛娱乐化齐头并进 AI 可以驾驭任何知名角色,更加擅长 逻辑性较强的绘制,从色彩、细节、 笔触、合理性等多方面比肩人类画师 抖音@forty_four
59. 应用场景开始涌现:设计师们如获至宝 来自各行业的高质量图片素材加入到大规模训练数据 集中,使得 AI 可以轻易生成高质量的设计作品,不 限于室内设计、建筑设计、Logo 设计、时尚设计、 商品设计、工业设计等几十个大行业
60. 2023 年,除了艺术,还有娱乐 马斯克在研究一种抗衰老配方,但失控了 轻松驾驭各种顶流角色,成为 2023 年泛娱 乐化的一道亮点
61. 麦当劳:2023 年六一儿童节 AI 营销事件 利用当下火热的 AI 真人模型和相 关 SD 生态精准控制技术,让现 实世界的成人“回到童年”
62. 所以借助超写实模型,AI 绘画不止于艺术,正在影响现实 影视制作 人体细节 平行世界 复现历史 恶搞时事
63. 案例展示:感受极度真实的人体解剖学细节绘制
64. 应用场景:为景区代言可行?
65. 复现历史?还是捏造历史?通过社交媒体影响新世代…… “上世纪 90 年代北京青年情侣”
66. 最近国际上发生了一件大事……
67. 特朗普攻打白宫精彩瞬间
68. 很不幸,被抓了……
69. 后来呢,众说纷纭……
70. 档案解密 :川普(原名川建国)同志,就此结束了在阿美莉卡的潜伏任务,从此过 上了美好的退休生活,到人民群众中去……
71. 也有人说他过得不太好,于是纷纷在小红书上记录了他的近况
72. 2023 年 5 月底马斯克访华,互联网上流传着两张热图 左图来自中国外交部官网 右图又是来自哪里?
73. 区分真假成了当下社交网络的压力
74. AI 绘画当下的处境,积极、消极、争议三面共存 积极面 越来越成为当下普通人反 映身边生活状态、去寄托 思念的利器 消极面 助长了一些违法犯罪的可 能性 备注:地铁女子被 AI 一键脱衣 争议面 毁誉参半,等待时代的证 备注:2023 年索尼世界摄影奖落幕,AI 明 作品《虚妄记忆:电工》荣获创意类大奖
75. 百万级女网红遭 AI 换脸,被贩卖假视频,普通人也可被 AI 辨 一 辨 本 尊 随着 AI 模型训练的逐步增强,仅仅几张到十几张高清 照片便可被“训”成一个专属真人模型。通过关键词 (prompt)即可驱动模型产生各种输出,达到制造假内 容的目的。所以有种说法,AI 时代,慎发抖音与朋友 圈,尤其告诫自己的父母。 注:来源,小红书号:547842471
76. 听一首歌,看一段视频 AI 视频技术#大叔秒变少女  收集原版孙燕姿的声音训练 AI,然后用这个 AI 版孙燕姿去翻 唱其他人的歌曲  事后孙燕姿并没有在声明中表达太多的维权要求,反而是表达 了她对 AI 技术的一些深思——  “我的粉丝们已正式改换门庭,接受我就是一名冷门歌手的事 实,而我的 AI 角色成为了目前的顶流。”  “没有什么是不可能的。缺乏情绪、感情对 AI 来说,可能只是 短期内的现象。”
77. 比骗感情骗钱更可怕的是,操纵股市 AIGC 影响股市的传播链条  骗子账户用 AI 画了一张五角大楼被攻击的图片;  后来有 300 多万粉丝的“今日俄罗斯”开始转发“有目击 者表示美国华盛顿特区五角大楼附近发生爆炸”;  标准普尔指数一度下跌 0.29%。
78. 面对这万般变化, 首先请掌握先进的生产力工具
79. DD 开启扩散模型元年  2022 年初,由独立开发者 Somnai 开发的 Disco Diffusion(简称 DD)在谷歌 Colab 云服务上正式对世界开放使用,4 月份开始在国内经很多设计与开源领域的大 V 传播至热,引发全民参与热潮,不限于如何使用这种 AI 生产力工具、AI 艺术 与人类艺术之争、版权问题,乃至对现有各种视觉相关行业的冲击几何,纷繁复杂,不一而足。  时至今日,DD 虽然在商业化上无法体现效率、边际成本、规模效应的优势,但其对 AI 艺术开源运动的引领地位被广泛认 可。  在美学角度,DD 对于色彩的大胆绘制往往令人“心驰神往”,但其并不擅长逻辑性,具有极为强烈的早期“AI 风格”,这 种纯粹追求对视觉的冲击效果也经常被壁纸类创作者所青睐,因此在 2022 年上半年的抖音、小红书等社交媒体上经常会看 到由 DD 所创作的“色彩美学”作品。 DD 关键词  https://397987634.notion.site/397987634/AI- 764e6a50fbf04327945a12a07ce9654f  https://mp.weixin.qq.com/s?__biz=MzAxMzMxNDIyOA==&mid=26555 48123&idx=1&sn=c0ef442671567457d0c3b6cd83920de3&chksm=80 18a300b76f2a16b808d64dbf4752e17a16951e553538fc1570ac3647 353f6489f3ccc68a74&cur_album_id=2433027791786229762&scene =189#wechat_redirect CLIP 模型在库艺术家  https://weirdwonderfulai.art/resources/disco-diffusion-70-plus-artist- studies/ CLIP 模型艺术修饰词  https://weirdwonderfulai.art/resources/disco-diffusion-modifiers/#top  https://matthewmcateer.me/blog/clip-prompt-engineering/
80. DALL·E:OpenAI 出品,曾经闭源的巅峰 Outpainting 震惊行业  DALL·E 是 OpenAI 在推出爆款应用 ChatGPT 之前的一个现象级产品,在 2022 年上半年的 AI 绘画产品赛道几乎处于“无 敌”的状态,因为它相比于 DD 等创业产品或 者项目,更擅长绘制逻辑性很强的事物,并且 符合人类描述,给当时“AI 只能绘制抽象之 美”的论调带来强烈冲击。  但遗憾的是,OpenAI 并没有持续将其进化到 极致,在推出一些爆点事件后,并未深入到 C 端大众市场,以致被后来的闭源产品龙头 Midjourney 从市场份额、出图效果、对各行 业的影响等方面完全超越。 《戴珍珠耳环的少女》
81. DALL·E 推出时各知名 AI 绘画产品/项目效果对比 2017 年 GAN 时期 Disco Diffusion 时间 Dream by wombo (基于 DD 的产品化) Midjourney V2 (2022 年 4 月) 随着扩散模型的不断技术迭代,以及大语言模型参 数和训练数据集的不断进化,AI 绘画模型宛如一个 出生的婴儿在迅速茁壮成长。几乎以周/月为单位, 每次的进化都令世人耳目一新,颠覆旧有的认知, 带给创业者对未来的无限遐想。 DALL·E
82. Midjourney,一种被增强的想象力 号称该领域的“苹果”,六边形战士,“共同想象的空间”  “Midjourney 已经成为了一个超级想象力的集合,数百万人共同探索 着这个空间的可能性。”——David Holz
83. Midjourney 作品题材展示 CG 题材 真实题材 二次元题材
84. 案例展示:prompt 催生精致的艺术 穿着高达盔甲的女 孩|战斗受损的盔 甲|是一个黑暗的 雨夜|史诗般的战 斗场面|战斗受伤| 详细的脸|极端的 细节|电影|杰作| 摄影|惊人的环境| 闪亮|光滑|超现实 |神圣|天体|漫画| 动漫|气氛|详细| girl wearing gundam armor| battle damaged armor| its a dark rainy night| epic fight scene| wounded from battle| detailed face| extreme details| cinematic| masterpiece| photography| stunning environment| shiny| smooth| surreal| divine| celestial| manga| anime| atmosphere| detailed| intricate| full of colour| cinematic lighting| hyperrealistic| focused| lumen reflections --v 5 复杂|充满色彩|电 影照明|超逼真|集 中|流明反射
85. 案例展示:传统 CG 艺术大受冲击
86. 陆川导演用 MJ 画电影概念图
87. 除了通用设计与艺术领域,MJ 在二次元领域也很强(Niji) @AI 艺术家 AIBEN
88. 2023 年网络上掀起用 MJ 对知名 IP 进行二创的潮流 艾尔登法环 灌篮高手
89. 版本对比细节(2022 年 4 月) Midjourney V2 更擅⻓抽象画面的输出,而在人体的 真实性上有较大缺陷,尤其不擅⻓画 人脸、人手等。 《 A I 艺术·中式克苏鲁》AIBEN 2022.5
90. 版本对比细节(2022 年 11 月) Midjourney V4 在真实性和氛围感、光影、艺术性上又 有了⻓远的进步。这使得 AI 绘画不再 局限于抽象场景的描述,而且可以用于 创作更为具象的场景和人物。 《 A I 艺术·机甲骑士》AIBEN 2022.12
91. 版本对比细节(2023 年 3 月) Midjourney V5 不仅仅做到了让 AI 绘画像照片一 样真实,同时也让整个 AI 绘画的 艺术性再次跨维度提升。已经有越 来越多的创作者使用 AI 绘画来结 合实际生产,从而降本增效,AI 绘 画的划时代节点已经到来。
92. 版本对比细节(2023 年 5 月) Midjourney V5.1 细节效果更夸张,简直堪比高清摄像 机。
93. 关于 MJ 的【进化飞轮】与【集中式社区】之间的关系 英伟达 AI 科学家 Jim Fan 曾猜测:  Midjourney 是根据人类反馈 RLHF 进行大 规模的强化学习  并且这可能是有史以来规模最大的文本到图 像强化学习  用户反馈越多,它的学习效果就越好 如果你把他们(用户)放在一个小组中,他们会说 “狗”,其他人会说“太空狗”,另外一个人可能会说 “Aztec 太空狗”。然后,突然之间,人们理解了各种可 能性,你正在创造这种增强的想象,一个让人们可以学习 Midjourney 五代版本进化对比 和发挥这种新能力的环境。所以我们发现,人们真的非常 喜欢共同想象,因此我们将 Midjourney 做成了社交,我 们有一个巨大的 Discord 社区,最大的 Discord 社区之 一,有超过 140 万人 (截止 2022 年 9 月) 在这些共享空间当中 一起想象事物。
94. Facebook Bing Image Creator Adobe Firefly Dreamlike.art 开源之王 Stableboost.ai 谷歌 Microsoft Designer Openart.ai 微软 Playgroundai.com Lexica.art Leonardo AI Krea.ai 一切创业产品的基座
95. 产品灭霸 MJ vs SD 生态联盟
96. 2022 年 8 月,AI 绘画最为重用的开源力量 Stable Diffusion “我们有 100 名员工,社区有 10 万人。这就是我们力 量的来源,我们来自世界各地。 我们释放了 Stable Diffusion,然后就有点疯狂了。 1000 个项目如雨后春笋般出现。 将 AIGC 交到数十亿人手中将带来新机遇的爆炸式增 长。” —— Stability.Ai 创始人 Emad Mostaque
97. Stable Diffusion 社区作品展示:二次元模型
98. 高质量 SD 二次元作品展示
99. Stable Diffusion 社区作品展示:真人模型
100. 高质量 SD 真人作品展示 作品示例 @forty_four(抖音博主)
101. 真人与二次元的融合,是 SD 社区广受欢迎的题材
102. 多样的画风,强大的质量,使得SD 在艺术领域也广受认可 AI 艺术家 AIBEN 用无界 AI 创作的剪纸风筝登上《工艺美术》杂志
103. SD 绘画实操三大要素 在 SD 生态社区需要熟练掌握  咒语(prompt)的编写  模型的选择  高阶参数的设定 关键词网站分享:  https://promptomania.com/stabl e-diffusion-prompt-builder/  https://promptomania.com/midjo urney-prompt-builder/  https://stable-diffusion- art.com/prompt-guide/  https://www.midlibrary.io/ 无界 AI 模型展示
104. 开源的复杂性催生产品的多样性  咒语(Prompt): 1个开心的小男孩和柴犬,草帽,光腿,光脚奔跑 在田野,黑头发,稻草人,黄狗,稻田,花,短发,汉服,大 雁,红色外套,牛仔短裤  Model: 美漫, CFG scale: 7, Hires upscale: 2, LoRA: 水墨-2(0.5)、吉卜 力(0.55)  https://m.wujieai.com/s/14T3FKD3 一键复制后打开【无界AI】APP 或 点击链接 自动填入全部参数进行同款创作  SD 在开放源代码后,与此同时也将复杂繁琐的“参数化操作”全部开放给 用户,对于刚接触的普通个人来讲,远比需要付费的商业化产品门槛更 高。因此开源运动催生了海内外大量以此为土壤的上层产品创新,哪一家 更能将繁琐的参数化操作优化为最简易、人性化的产品交互,哪家便越能 俘获早期市场用户的首选。  国内 AI 绘画产品的创业大潮始于 DD,而繁荣于 SD。无界 AI 便是依托 SD 开源土壤成长起来的国内头部 AI 绘画产品,其将咒语编写、模型选 择、高阶参数设定的操作门槛降低到了连普通小白都能轻易上手的程度, 因此在 2022 年便已经突破百万用户,是国内最活跃的 AI 绘画社区之一。
105. SD 开源技术与模型生态极为繁荣和强大 SD 官方源代码开源之后,更多生态配套的开源力量随之涌 现,造福社区:  模型训练:Dreambooth,Lora,Textural-inversion(.pt)  精准控制:ControlNet、SAM 精准 控制 仅依靠 SD 官方一 个基础模型(sd 1.4/1.5)并不足以 产生五彩缤纷的 AI  模型开源库:10000+ models(civitai、huggingface) 绘画体验,它仅仅  开源操作界面:SD Webui 是一个基础的“通  多模态内容形态:AI 视频、AI 3D…… 用底子”,需要更 多开发者在其基础 之上进行更多样 开源 UI 模 场 广 型 化、更高质量的风 格化训练。 于是便有了以模型 广场、精准控制、 训练框架为代表的 大规模免费模型生 态。模型的涌现, 造就了行业应用的 涌现。
106. SD 模型生态的繁荣让各行各业都在采用 Embedding Dreambooth LoRa 模型大小 几十 KB 2~4 G 8~140 MB 使用时是否需要加载 否 是 加载对应 LoRa 需要的训练资源 显存要求很低 较高显存,> 12 GB 显存适中,> 7 GB 一般用于的训练场景 人物 画风,人物 人物、画风 市场使用强度 一般 较强 很强 抖音 AI 特效:二次元模型、模型训练 SD 生态三种主流模型训练方法及其优劣 模特换装、室内与建筑设计:行业垂直模型、精准控制技术 营销大赛:人人都训练可口可乐 Logo、雪佛兰汽车模型
107. 不限于图片,多模态开启:SD 引领 AI 生成视频方向 早期的“短视频转 AI 动画序列帧” 4、5 月份抖音上很火 #AI动漫 AI 视频走向娱乐商业化 #瞬息全宇宙 #穿越漫画遇见自己 AI 视频日臻完善 解决方案: 更多样、更有趣的 AI 视频(如“无 SD + ControlNet + 限镜头”)燃爆全网,采用技术: Temporalkit + Ebsynth + SD Deforum、inpainting、outpainting 后期处理
108. 利用 MJ zoom out 实现无限缩放镜头
109. AI 视频方向的重要力量 Runway,Gen 开启一键式 AI 视频时代 OUTPUT INPUT 输入:一段原始的真实视频 + 一张风格化图片 输出:风格化的 AI 动画视频
110. 无需原视频输入,一张图片 + 一段文字,也可生成 AI 视频 image prompt: OUTPUT INPUT text prompt: 在一个低角度拍摄 的画面中,男子正沿着街道行走,周围 酒吧的霓虹灯照亮了他的身影 Runway Gen 让抖音短视频更有趣
111. 最强技术形态:直接用文字输出 AI 视频 text “AI 原创短片《旧 prompt: 时光》,全部视频 在纽约市的 由 GEN-2 制作直 一间阁楼 接输出,所有文字 里,傍晚的 由 ChatGPT 提 阳光透过窗 供,我仅合成了片 户温柔地洒 头和字幕。模仿了 进屋内 王家卫导演的风 格,效果非常震 撼,我一个外行居 然也能输入几个字 就做出一个视频。 AI视频时代来 text 了。”@穿行者 prompt: 一只眼睛的 特写镜头 (公众号:今说新 “Gen-2,真正的 AI 短视频时代要来了” 语)
112. 场景已现,创作涌现:人人化身“抖音达人” text prompt: 白日依山尽, 黄河入海流。 还会有更多形态的 AI 视频,以 欲穷千里目, 及更多股的技术与商业力量 更上一层楼 Wonder Studio 精准替换人物 D-ID 将静态AI图片变为数字人
113. 利用 AI 绘画+视频技术创作低成本 AI 数字人 一位网友缅怀他故去的外公,将外公的照片上传到 AI 绘画平台,获得了外公的一 张 AI 艺术照片,并用 D-ID 驱动“AI 外公”说话 从外公生前的视频中提取音 频,做到音容笑貌的还原
114. 不断进化的底层技术都属于所有社区生态参与者 SD Reimagine 允许用户仅通过图片生成其多种变 体,无需文字 prompt 介入,大大降低生成门槛 生态发力的三个主 要方向: 1. 更简便的生成 2. 更精准的控制 3. 更高的细节质量 SD Controlnet reference-only 允许用户仅需使用文本提示词, 就能在保持图像主体特征的前提 下,任意修改图像细节 Meta 开源的 SAM 可精准控制 画面中的语义元素,实现精准抠 图与替换
115. 结合使用 MJ 的高质量出图与 SD 的精准控制 SD Controlnet reference-only 对其 MJ V5 出原图 生成变体,进一步精 细调整 Midjourney 擅长出商业级线稿 (1)MJ 关键词出线稿图 SD Controlnet 擅长线稿上色,立体化,出成品 (2)Controlnet 线稿上色 (3)“tile 分块”放大像素与细节
116. SD MultiDiffusion 让超大分辨率生成成为可能 生态发力的三个 主要方向: 1. 更简便的生成 2. 更精准的控制 3. 更高的细节质 量
117. 强大的工具和生态带来强大的生产力, 然而,生产关系也需要跟随新生产力的 前进步伐完成自我的纠正和进化……
118. 漫画《你也配》赏析:时代的鄙视链,技术变革的必由之路 鄙视 使用电脑的艺术家 将来: 脑机接口兴起时 使用 AI 的艺术家 鄙视 今天:AI 刚兴起时 使用 AI 的艺术家 鄙视 使用纸的艺术家 过去:电脑刚兴起时 使用电脑的艺术家 结果证明, 不论是谁,都会被鄙视 使用脑电波的艺术家
119. 人类顶级画师 VS AI 创作社区 1小时后 阮佳成品 社区挑战
120. “画师因抵制 AI 被冲被人肉,去世三年【焦茶】作品被喂 AI 炼丹”
121.  由 Midjourney 生成,是 Kristina Kashtanova 的作品, 去年因为成功申请到了版权保护而大出了一阵风头。  没过几天,版权局又变了卦,指出 Midjourney 输出的作 品中没有人类撰写的元素,所以不能获得版权保护。
122. 国内第一份 AIGC 监管文件;走向和解 2023 年 3 月 16 日,美国版权局发布 了《版权登记指南: 包含人工智能生成材 料的作品》,以阐明 在审查和注册包含人 工智能(AI)作品的 保护范围、具体注册 要求和方式。  不要侵权  不要侵犯隐私  其他的,要抓紧干
123. 理由一:AI 始终是工具,当由人来驾驭 AI 和使用者之间的关系将会形成飞轮,AI 帮 助使用者提高生产效率,同时使用者也为 AI 贡献数据养料,相互促成正向激励,在这个 意义上,AI 是人类的助理,而人类是 AI 的 老师; 一 种被增 力 象 想 强的 君子生(性)非异也,善假于物也 ——荀子《劝学》 ——OpenAI 的首席科学家/联合创始人 ILya Sutskever
124. 理由二:深入新技术的本质,不要被表面欺骗 搜索 “a corgi playing 返回 数 据 库 基于超大数据量(图文对)的预训练模型 a flame throwing “一模一样,侵权” trumpet” 输出 扩散算法 正确打开方式:深度神经网络模型 + 扩散模型 比如输入一个 prompt:**可爱的女孩**,CLIP 算法作自然语义处理的时候会根据之前被程序员调教的经验,大概 感知到可爱的女孩可能具有哪些特征。然后将特征向量投入到扩散模型(如 UNET)进行解析输出
125. 理由三:对未知常怀敬畏之心,超大规模神经网络的神奇“涌现” 在复杂系统学科的定义中,当一个复杂系统由很多微小个体构成,这些微小个体凑 到一起,相互作用,当数量足够多时,在宏观层面上展现出微观个体无法解释的特 殊现象,就可以称之为“涌现现象”。 刘慈欣:“人们常说人工智能没有人的灵魂、人的感受,这不过是一个自我安慰。 人自己的灵魂、感受,也是很多神经元细胞连接成复杂系统后涌现出来的。” 顿悟现象(“Grokking”) 如将数据集切成两块,50% 数据 作为训练集(图中红色),50% 的数据作为验证集(图中绿线)。 它的训练动态会经历三个阶段: Google 发表了题为“大型语言模型的涌现能力”的论文,考察了  记忆:这些例子我记住了 以 GPT-3 为代表的语言模型  平台:我再想一想  发现语言模型的表现并非随着模型规模增加而线性增长,而是  泛化:我明白规律了 存在临界点  只有当模型大到超过特定的临界值,才会涌现出较小的模型不 具备的能力。 一般来说,当大模型参数突破几百亿~上千亿参数时, 大多数任务可以具备涌现能力
126. 强大的通用能力,无止境的进化,注定会是人类的好帮手 GPT 4 完成并通过了公认难考的四大会计行业执业 资格考试,包括注册会计师(CPA)、注册管理会计 师(CMA)、注册内部审计师(CIA)和注册税务师 (EA),平均得分 85.1。 几个月前,ChatGPT 3.5 没能过关。 之所以两代 GPT 产生差异,主要源于新一代有了新 的插件,这些插件赋予它“推理和行动”的能力。 最近硅谷黑客 George Hotz 披露了 GPT-4 的秘密: GPT-4 实际上不是一个大模型,而是 8 个 2200 亿参数的大模型组成的。这 8 个大模型结构完全相同,只是用的训练数据不同, 所以可以理解为具备不同能力的 8 个大模型。GPT-4 生成内容的时候,是让这 8 个大模型总共推理 16 次,最终选举出来最优的 结果。
127. 细数 13 大行业, 让 AIGC 成为赋能产业的 “第四次工业革命”
128. 就业影响:新兴岗位出现 2023Q1 AIGC 领域招聘年薪中位数达 33.75 万元(猎聘数据)
129. 数据的人工标注是大模型不可忽略的一环 图为一家国内数据标注工厂  曾经,著名的 ImageNet 项目背后,是来自 167 个国家的 5 万名数据标注员,他们足足 国内主要分布在——  贵阳,大数据之城 花了三年时间才完成了全部图片的标注。  太原  面对海量的互联网信息,帮助 GPT 标注的是  新疆和田 肯尼亚人,每天要标注超过 200 段文字。  河南 这些工人大致一个月挣 2500~3000 元人民币, 比当地一般蓝领工作强些。 职责是为训练人工智能模型 准备“饲料”,将大量的文 字、语音、图像打上标记— 但非常伤害标注人员的心理健康。面对有害信息时,由于每 天阅读大量极具冲击力的文字,有人会因为一段描写而做上 一周噩梦。 “西方的每一次进步都包含了非洲人民的血和泪” —“眼珠”、“四川话”、 “绿化带”。 一个月能赚三千块左右。 截止 2022 年,全球的数据标注师超过 500 万人
130. “GPT-4 替代年薪 60 万的数据分析师只要几千块” 阿里达摩院最新论调:  GPT-4 的表现,在大多数指标上 “GPT-4 替代初级数据分析师的成本 能与一位 6 年工作经验的人类相 只有 0.71%,换成高级数据分析师则 当,正确性低于人类,但复杂性和 是 0.45%……” 一致性指标高于人类。 按新加坡行情,年薪 8.6~9 万美元  如果与 2 年工作经验的初级分析 (60~63 万人民币)的高级数据分析 师对比,GPT-4 在正确性上表现 师,换成 GPT-4 就只需要三四百美元 更好,而且能完成更多的工作。 (2000 多人民币)
131. AI 十字路口:向左是“毁灭”,向右是“重生” “AIGC 必然会取代 一大批人,造成大量 的失业。但与此同 一家游戏美术外包公司原本 时,它也会给小公司 38 个原画师,现已裁掉 20 个 和个人带来从未有过 的机遇。” ——逗砂 劳动密集的公司会越来越少,几个人,十几个人的小公司将随处可见。大 公司也会开始瘦身,产业开始从以人驱动,转变为以算法和算力驱动。
132. Midjourney 十一人公司结构 记者问:“这会是 AI 时代的创业公司组织形式 的新范例吗?” Midjourney 创始人 David Holz 答:“ 我想未来会的。 随着人们学会如何建设研究团队,随着算力的压 力越来越小,随着人们越来越懂得如何打造好的 AI 产品,我想我们将会看到很多这样的公司。 我们可能是第一家这样做的公司,但也许在 5 年 后这会是非常常见的形态。”
133. (1)泛娱乐产业:越来越多流量博主涉足 AIGC 内容形态 当今抖音充斥着大量 AIGC 介入的短视频 越来越多的短 视频博主在借 助 AI 的力量提 高自己作品的 创作质量和效 率,AI 带来的 崭新内容形态 也吸引了一大 波消费者的关 注和好奇尝鲜
134. 批量生产 AI 颜值博主 先进技术的到来,必然催生全新的审美。 当今以小红书、抖音为代表的社交媒体上, 开始充斥着大量“非人类”博主 爱旅游的小多: “旅行博主”,主打通过赛 无敌 AI 喵喵妹: 博空间看世界,今天北方看 多元身份,新娘、篮球少 雪,明天去海边度假,仅用 女、女将军、黑帮大姐…… 了 20 天就走遍了四季 “AI 越来越像真人,网红越来越像 AI”
135. 网红的变迁:时尚杂志和明星 —— MCN 机构和博主 —— AI 团队配置 MCN 机构 生成式 AI 内容、摄影、后期、推广团 AI 绘画师 队 培育周期 博主条件 数月、数年 貌好,身材,穿搭,性格, 数周 无 “ 说不定有一个网红大楼,里面关了一堆大 哥哥做图 ” 特长 市场空间 逐渐饱和、内卷 蓝海市场 投入成本 几十万、上百万 几千 硬件场地 网红大楼 显卡 产业链开始形成? 在小红书有上万粉的 AI 颜值博主们中, 十个里面有九个来自广东
136. AI 博主变现方式 AI 颜值博主的变现方式有流 @小星星 直接在群里售卖起了 AI 绘 量转换、打赏、品牌合作、 画课程 广告投放、电商推广和私域 卖课等。 @天高不高-AI 有 4 个 AI 群,群成 “卖课是变现最快,也是博 员近 1500 人,虽然如今是免费分享 主最常使用的方式。” 教程,但为后续变现打下基础
137. AIGC 资本主义“萌芽” 工业革命催生资本主义,AIGC 催生创作者经济的资本主义:AIGC 正在极大影响到今天自媒体、短视频等创作的单位时间劳动成 本;作为创作者群体赖以生存的“雇主”,流量平台将会对商品服务进行重新定价,进而带来新一轮的收益配比;而无法跟随技术 进步趋势的创作者们,将越来越失去生存的土壤。 抖音有声读物之 AI 小说漫画改编
138. (2)影视制作行业:《这就是街舞5》MV 用 AI 进行背景创意设计 八张 AI 出图提供了 MV 背景氛围创意灵感 视频赏析:无界 AI 社区作品《AI 眼中的崂山四季》@然后(李超导演)
139. (3)广告传媒行业:AI 出图,更具传播效果 飞猪旅游广告,国内首个 AIGC 线下广告 越来越多的小游戏广告选择 AI 二次元出图
140. (4)专业设计工具:设计师开始直面 AIGC Figma 集成越来越多的 AI 插件,设计师 Adobe Firefly 的加入,预示着 只需要画出寥寥几笔,AI 就可以渲染出细 AIGC 向着可实用性工业设计的质 节(插件:Ando) 量要求和工具流进军 Generative Fill:Adobe 把 inpainting、outpainting 加入到 PS
141. Generative Fill:Adobe 把 inpainting、outpainting 加入到 PS 案例 1:outpainting 无限扩展表情包 案例 2:outpainting 无限扩展照片和名画
142. 网友利用 MJ v5.2 zoom out 功能为马斯克做了八角笼对战图
143. DragGAN:AI 图片编辑神器,拖拽就能 P 图 DragGAN 开源网址: https://github.com/Xin gangPan/DragGAN DragGAN 由 MIT、谷歌、马普所等机构联手打造,展示了一种控制 GAN 进行 图像处理的新方法。“通过 DragGAN,任何人都可以通过精确控制像素的位置 来变形图像,从而操纵不同类别的姿势、形状、表情和布局。”
144. (5)外包装设计:食品工业设计案例 AI 出纹理图 传统包装设计软件 包装样稿  钟薛高的新品冰棍 “Sa'Saa”,从口味研 发、命名,到宣传、包 装设计均由 AI 参与甚 至主导  伊利、可口可乐、王老 吉、安慕希、雀巢等品 牌,也发布了由 AI 辅 助设计的包装  果壳网✖️ 牛啤堂,利用 AI 合作设计的一款啤酒
145. (6)营销辅助:奇瑞ICAR x 花瓣 x 无界AI 合办大赛,为奇瑞创作虚拟人 AI 头像生成是一个深受欢迎的营销场景 备注:内容来源,逗砂,公众号:AIGC研修社
146. (7)电商设计 Product photography, facial cleanser, background foam, natural light, futurism, style of Van Gogh, realistic, horizontal perspective composition, surrealism, C4D rendering 产品摄影、洗面奶、背景泡沫、自然光、未来主义、梵高风格、写实、水平透视构图、超现实主义、C4D渲染
147. 真实案例:AIGC 初具成本和效果优势 传统 3D 建模 借助 AI 出图 800-1200 元/张 < 1 元/张 2~3 天 2~3 小时 从 C 端电商用户体验 角度,AI 生成的设计 效果已经能够商用 AI 设计的床头灯 @设计师郭子(小红书博主)
148. 线稿借助 AIGC 进行【内容裂变】,几百个 IP 供选择 人类设计师只负责线稿绘制,然后使用 AIGC 生产力短时间内获取大量高质量出 图,从中筛选符合商品需求的灵感作品或 者最终成品
149. AIGC 大大降低需要实景拍摄的商品的展示成本  过去:场景搭建&实景 两周 一小时 外拍、模特拍摄、商品 拍摄&建模、后期修 图、设计制作等 5-6 个环节 商品内容的生产流 程发生结构性变化  现在:静物素材(拍摄 &建模)、AIGC 合成 场景、设计制作等 3 个环节
150. (8)服装模特:AI 模特成为热门应用场景,有望带来结构性成本变革  过去与现在, free information everywhere 免费的信息无处不在  不久的将来 , 2023 年,AI 绘画涌现出一大批适用于服装设计行业的 任何改变社会、改变产业的, 真人模型、控制插件,正在深刻影响跨境电商、时装设 永远是结构性改变。这个结构 free models 计等行业,大大降低成本。“毕竟定制一个模型比请模 性改变往往是一类大型成本, everywhere 特便宜多了。请一个模特少则几千多则上万,相比下来 从边际成本变成固定成本。 68 元出 6 张图的 AI 不仅价廉而且省事许多”。 ——陆奇 免费的 AI 模型无处不在
151. AI 模特效果出色 真假模特视觉效果对比 模特不止于真人 一条 AI 生成的“小绿裙”火遍了小红书
152. (9)跨境电商:如获至宝,玩出天际  先用 AI 绘画技术出虚拟人的静态图片,  然后用 AI 视频技术驱动虚拟人图片动态说 话,  配上商品解说录音(也可以替换为 ChatGPT 问答,作为 AI 客服人员),  便是一个全天候的 AI 商品虚拟主播。由于 跨境电商的全球市场需求,此类应用广受其 欢迎。
153. 附加:实现 AI 模特四种方法 垫图 效果: 50%~60% 模型训练 换脸 效果: 70%~90% 局部重绘 效果: 100% 效果:90%~100%
154. (10)服装创意设计:不止于模特,直接赋能服装设计师 样 多 式 款 成 生 富 丰 节 细 用 实 稿 线 单 简 关键词:Design sheet for a evening dress . Halter dress , v - neck , light green , high detail(晚礼服设计单,v领吊带裙,浅绿色,高细节)
155. 案例展示:AI 鞋服设计实战一条龙 <1>AI先出线稿 <2>AI线稿上色 <4>AI生成脚模,展示效果 <3>AI生成更多变体,以供筛选 <5>AI生成全身模特,卖家秀 注:案例来源,小红书@AIGC666
156. 一个小实战技巧:人人都可以成为 H&M 设计师 1. 将真实世界 2. 用 AI 将图片内 3. 将描述变成 AI 绘画工具 照片上传 容描述出来 的 prompt 注:案例来源,小红书@uisdcai
157. 无界 AI ✖️ 温州鞋服产业 ✖ ️ 森马服饰:AIGC 大赛实现全民创意涌现 AIGC 让鞋服 企业获得成 千上万的民 间设计师, 实现设计创 意的全民涌 现,增强企 业创新活力 围绕“童装设计”主题,网友、专家从 2000 多件 AI 设计稿中投票选出前 20 名。 该项赛事由中国 AIGC 产业联盟与温州市社科联指导, 科研机构、技术企业和公益机构相聚,通过组织一系列赛事、沙龙和调 温州 AIGC 产业联盟和温州市服装商会共同发起,是全 研,旨在推动生成式人工智能在温州鞋服和文旅等行业的应用,打造 国首个基于 AIGC 的鞋服行业准专业级设计大赛。 GPT 时代的中国数字经济未来高地。
158. (11)动漫行业:AIGC 最强阵地 一本 40 页的漫画,10 秒一张图,一小时出书 无界 AI 尝试动漫制作
159. (1)与美国判例不同,在日 本,此类 AI 速成漫画依旧在版 权法的伞下。  日本的理解:速成漫画约等 于一个剧本作者请了一位作 画助手。在日本漫画界,这 种创作模式早已是常规操 作。  举例来说,“爱的战士”虚 渊玄做为一名手残的编剧, 就经常在写好剧本以后联系 画风合适的漫画家,请对方 根据脚本创作漫画。
160. 视频赏析:从漫画到动画,超燃 AI 动画《石头剪刀布》 国内首支 AIGC 动画《神弦曲-猫儿与时光铃铛》 与《石头剪刀布》不同,只是在动画中的背景(或场景)绘制中 使用了 AI 出图,而动画中的人物依然由人类设计师操刀。这也 是当下 AI 渗入动漫制作领域的一个过渡阶段。
161. 实现上述丰富内容形式的 SD 生态另一把利刃: ControlNet ControlNet 的出现完美解决了 AI 绘画发展进程中“精准控制” 的难题。它将【设计】分解为【线/轮廓】、【深度】、【语 义】、【姿势】等众多基础原子,根据应用场景,随心所欲地组 合这些基本原子,实现绘制的整体可控性。 例如,【语义分割】可 以精准识别图中汉字所 在的区域,进而实现海 报的制作。 注:内容来源,逗砂,公众号:AIGC研修社
162. 用点线图(骨骼图)控制要绘制人物的身体姿态,例如可轻松绘制人物的三视图以及手势等体 态,也可以用多幅骨骼图实现多人打斗等复杂场景。同时,如果用户上传带有人物的底图,该组 件也可以提取底图中的人物骨骼,进而实现控制输出
163. 边缘检测,即提取用户所上传底图中的轮廓信息,然后按照轮廓进行控制输出,因此常用于品牌 logo 的创新创作。(注:内容来源,逗砂,公众号:AIGC研修社)
164. 在漫画场景中如何使用 ControlNet 的 pose 和 canny 骨骼控制 OpenPose 线稿控制 Canny
165. 如何结合使用 pose、canny、scribble 注:内容来源,海辛
166.
167. 无限的组合,无穷的方案,动态制作不是难题 动态视觉解决方案 Openpose+ Depth+ TemporalNet
168. (12)游戏产业:大厂们向游戏“不可能三角”发起挑战 米哈游  《崩坏:星穹铁道》  AI 场景:角色行为管理、3D 建模调优、NPC 台词等 质量(PGC)  打造“对话永不重复的智能 NPC” 网易  《逆水寒》  类 ChatGPT 对话模型,让玩家体验与 NPC 的开放式对话 AIGC  其他 AI 场景:剧情生成、AIGC 美术和 AIBot 等 成本 腾讯  基于 AI Bot 与 AIGC 两大方向的自研 3D 虚拟场景自动生成解决方 案,大幅提升 3D 虚拟场景的生产效率 UGC 游戏制作“不可能三角” 速度
169. 游戏初创公司的存活率开始上升,因为 AIGC 经典游戏制作流程: AI 倒排流程出现: 1. 原画师出草图 1. AIGC 工具生成海量平面设计方案 2. 美工班组完善精修 2. 设计总监挑选定夺 3. 设计团队出策划和脚本 3. 交由专业设计团队进行策划和脚本写作 4. 设计总监定夺 (时间需要 3 到 6 个月) 缩短游戏出品时间大约 20% 至 30% 结论:本来,资深原画师、美工班组、专业设计团队大约占游戏项目开支 的 30% 至 60% 左右。但在 AIGC 缩短出品时间后,成本开支显著减 少,则初创公司存活率从 20% 上升到 35%
170. 降本增效显著,从 2D 制作开始 在降本增效上,AIGC 在场景类的 2D 画面上,已经 能够替代过去原画师 80% 工作量
171. AI 3D 制作未来更加可期 在未来 1-2 年中,AI 生成 2D 画面将越来越成 熟;但要在 3D 上取得更好的效果,或许还需要 5 年时间 在 3D 画面上,许多 AI 3D 工具的推出,也让过 去需要一个月才能够做出来的 3D 人物,制作时间 缩减 90%  一张很小的人类设计师原 画,借助 AI outpainting 生成宏大的场景图片;  配合 AI 2D 转 3D 技 术,直接生成一个 3D 的 游戏场景
172. (13)室内设计:深度图(Depth)常用于室内装修
173. 无界AI 让毛坯一键变精装
174. 线段(MLSD):从人类精装到 AI 精装
175. 线与深度是 AI 参与室内设计最重要的元素控制 也可以从线稿到精装 案例 @小红书号: AIGC666
176. 无界 AI ✖ ️ 三维家:配合垂直的专业室内设计模型,效果更出色 “无界 AI 与三维家达成战略合作!共同将 AIGC 技术应用于家装设计行业,通过无界 AI 领先的算法技术,辅助当前的家装设计流程,打造全新的行业业态。通过 AIGC 打通制 造业的数据一体化,双方将共同探索定制专注于家装设计行业的模型”
177. 面对众多行业,需要掌握全栈式 AIGC 工具集合 对话 AI 图片 AI 视频 AI 文章 AI 音频 AI
178. 文生音乐对比 描述(prompt):A grand orchestral arrangement with thunderous percussion, epic brass fanfares, and soaring strings, creating a cinematic atmosphere fit for a heroic battle.(一个宏大的管弦乐安排,雷 声般的打击乐器,史诗般的铜管喇叭声,以及翱翔的弦乐,创造了适合英雄战斗的电影氛围) 更多示例参见,https://ai.honu.io/papers/musicgen/
179. ChatGPT 帮助文书类员工提升了 59% 生产力,且交付质量更高 没有用 使用 ChatGPT ChatGPT 交付时间 27 min 17 min 提升 59% 交付质量 3.8 分 4.5 分 质量显著 提高 文书类工作可以拆分为三个步骤:  内容构思,耗时占比 25%(明显提升)  撰写草稿,耗时占比 50%(大幅度提升)  润色修改,耗时占比 25% 4 月 12 日,知名公关及广告服务商蓝色光标 (300058.SZ)华东区总部运营采购部下发邮件—— “为了遏制核心能力空心化的势头,也为了给全面拥抱 AIGC 打下基础,管理层决定无期限全面停止创意设计、 方案撰写、文案撰写、短期雇员四类相关外包支出。”
180. 小红书 AI 文案,更懂爆款 先把这款鞋子的关键词提取出 来,例如:女鞋、玛丽珍、高跟 鞋、百搭、复古、春季。 • 通过对小红书上的热门商品和关键词进 行分析,确定适合自己的产品和目标受 众 • 然后,利用批量矩阵内容的方法,快速 AI 生成大量的笔记 • 并在测试中不断优化和调整,最终实现 了产品的出单和曝光率的提升
181. 需要具备结合多种 AIGC 工具流进行创作输出的能力 文本到视频:RunwayML Gen-2 文本到图片:Midjourney 面部动画:DID 文本到语音:Genny.Lovo.ai Soundtrack:Soundful.com 角色配音:ElevenLabs
182. 总结(1):AI 绘画带来两大类新职业,影响到 20 多种大行业 擅长 AI 绘画的人可分为两大类—— • AI 绘画师(俗称“魔法师”) • AI 模型训练师(俗称“炼丹师”) 已经开始渗透到—— 短视频、泛娱乐、数字藏品、数字营销、广告传媒、影视制作、鞋服设计、食品设计、外包装设 计、电商设计、IP 设计、服装模特、跨境电商、漫画制作、动画制作、游戏制作、室内设计、建 筑设计、潮流设计、儿童教育等 20 多种大产业大行业。
183. 总结(2):从 AIGC 到 AIGS 再到 AIGX AI 预计将在未来十年内为全球经济贡献 15.7 万亿美元,相当于当前全球经济的 14% • 这种影响力的来源不仅来自可以提高生产效率,更来自 AI 可以创造新的产品、服务以及商业模式。 1. 当下,以 AIGC 为核心阶段,源于“GC”(即生成内容)是最快、最简便、最有效触达到数以亿计的普通 C 端消费 群体的商业模式,“人人成为艺术家、漫画家、设计师、咨询师、KOL……”的口号不绝于耳。 2. 往更大了推演,“GC”的下一步必然是“GS”(即生成服务),会是对过去互联网与移动互联网 30 年来创立的所 有深入生活的 APP 的新一轮改造,Stability.AI 所提出的“Foundation Models as a Service”(FMaaS)将无处 不在——环境(ambient )AI 时代。 3. 而所谓的 AIGX(人工智能生成任何可能的新形式),将创立全新的伟大商业模式。历史规律都预示着任何一轮大技 术变革的同时都伴随着可以影响世界商业格局的超级商业模式的出现。大模型本身可以技术“涌现”,而当整个世界 万事万物都具备“智能”后,何尝不会带来一种“行星级”文明涌现。
184. AI 之所至,无远弗届 获取完整版研究报告

首页 - Wiki
Copyright © 2011-2024 iteam. Current version is 2.124.0. UTC+08:00, 2024-05-02 10:09
浙ICP备14020137号-1 $访客地图$