在变化中抽象不变:技术变局下的架构师升级之想
如果无法正常显示,请先停止浏览器的去广告插件。
1. 在变化中抽象不变:
技术变局下的架构师升级之想
阿里云 资深技术专家 / 邹娟
2.
3. 目录
• 引子
• 关于技术变革
• 抽象思维与思考体系
• 举例说明:持续学习与实践中成长
• 总结与展望
4. 引子
Midjourney v1-v5的效果变化
v1
2022.2
v2
2022.4
https://aituts.com/midjourney-versions/
v3 2022.7
v4
2022.11
GPT-1~GPT-4的参数量变化
GPT-1(2018.6) 117 million GPT-3(2020.6) 175 billion
GPT-2(2019.2) 1.5 billion GPT-4(2023.3) Estimated to be in trillions
v5
2023.3
5. 关于技术变革
本质
科技领域引入新的技术和方法
改变:人们的生活生产方式、
社会结构、文化形态…
促成:社会进步、人类文明发展
与架构师的关系
变
化
架构师的定位 科技领域的专业人士
架构师的职责 设计构建复杂的技术系统、
应用架构
技术变局带来
的挑战与创新
1. 技术趋势的理解
2. 新的架构模式、设计方法
3. 新的技术选型
6. 技术变革 --> 架构师成长:自身竞争力提升
拓宽知识面
新技术躬身入局
促进创新
技术变革带来的新技术、新工具、新平台等都是架构师必须掌握的知识点
技术变革带来的新技术和工具需要架构师自己动手了解、学习、实验。
相对的,可获得更多实践经验和技术洞察力,提升架构师的专业能力
技术变革会带来新的想法、设计思路和解决方案,架构师的创造力得到提升
跨领域能力加强 技术变革往往涉及多领域和多项技术
将促使架构师在不同领域之间思考跨领域技术融合应用的方案
职业发展空间扩大 技术变革会带来新的市场需求和发展机会
这也是架构师扩大职业发展空间的机会
7. 抽象思维:架构师最重要的素质
收集信息、抽丝剥茧、总结归纳、提取共性:在变化中抽象不变
“人们经常问我:未来10
年什么会被改变?我觉
得这个问题很有意思,
也很普通。从来没有人
问我:未来10年,什么
不会变?在零售业,我
们知道客户想要低价,
这一点未来10年不会
变。他们想要更快捷的
配送,他们想要更多的
选择。”
形成抽象的
设计模式和
架构模式
形成通用的
设计原则和
最佳实践
设计灵活,
可扩展,可
维护的技术
架构
抽象思维是架构师最重要的素质之一
从复杂的业务需求和技术需求中抽象出不变的核心
保持对系统演进的敏锐洞察力
8. 抽象思维 建立完整思考体系
提出问题
发现问题
解决问题
技术方案选型
• 公司内部其他团队的类似方案
• 国内公司的类似方案
收集问题
• 海外公司的类似方案
• 技术方案的优势(亮点、竞争
总结问题
力、业务落地性)
技术方案实现
设定解决问题的目标
• 11
• 22
结果反馈
9. 如何进行抽象架构设计
业务
架构
• 确定业务需求
• 定义系统功能和组件
• 架构模式选择
• 系统层次结构设计
• 定义接口和协议
内外双循环
评审
验证
迭代
实现
• 技术栈选择
• 稳定性,安全性
• 性能,成本,灵活性
10. 持续学习与实践中成长
例1: 阿里云视频云AI的架构设计 –- 摸索中演进(2017-2019)
2
3 应用
智能体验馆
内容策划类
内容创作类
智能封面
TTS
视频分镜
4
4
1 原子AI能力
ASR
数
节奏分析
人物识别
主体识别
4
肢体/动作识别
Metadata
体系
Highlight
风格迁移
OCR
视频分割
颜色分析/调色
据
服
务
标签库
人物库
镜头库
内容管理类
场景化视频云智能服务
智能审核 内容理解
智能制作 ……
日
媒资
志
……
基础元数据
5
全
链
路
监
控
AI
媒体DNA
内容包装类
5
任务调度
剪辑
版权
策略解析
11. 持续学习与实践中成长
例1: 阿里云视频云AI的架构设计 –- 摸索中演进(2017-2019)
阶段
变化的部分 不变的部分(抽象)
若干种AI原子服务 统一的AI任务协议与处理流程
多种场景、AI效果的展示 前端的组件化设计
统一的服务端代理转发服务
多应用服务的实现逻辑 多应用调用AI服务的流程
4 支撑体系设计 内容库多实体、全链路监控 动态元数据、特征值管理体系
全链路统一日志格式
5 场景化AI服务 AI场景服务与适配层 AI服务通用层
1 原子AI服务
2 智能体验馆
3 应用实现
12. 持续学习与实践中成长
例2: 基于通用原子算法实现场景化能力的工程模型设计
智能生产 -- 制作领域
原子视频AI算法
Face1
Face2
Face3
智能生产
内容理解
智能审核
1. 成片
2. 素材
3. 时间线
OCR1
AI服务场景层(适配层)
OCR2
4. 直播流
内容理解 -- 媒资领域
Label1
Label2
1. 综合标签
Label3
2. 媒资实体关联
Pose
文件分析
AI结果合并
结果集预处理
智能审核 -- 播控领域
1. 内容审核
AI服务通用层(不变的部分)
工程层多模态:快速适应场景,集众家之长,容灾切换
2. 技术质量检测
3. 内容质量评估
13. 持续学习与实践中成长
例3: AIGC与视频内容创作
明确的
…...
不明确的
时间线编排方式
人工:视频内容创作 智能化:视频内容创作
时间线编排方式
AI检测、识别
AI能力
…...
AI生成(AIGC)
14. 抽象思维 建立完整思考体系
提出问题
发现问题
解决问题
技术方案选型
• 公司内部其他团队的类似方案
• 国内公司的类似方案
收集问题
• 海外公司的类似方案
• 技术方案的优势(亮点、竞争
总结问题
力、业务落地性)
技术方案实现
设定解决问题的目标
• 11
• 22
结果反馈
15. 持续学习与实践中成长
例3: AIGC与视频内容创作 – 阿里云智能媒体生产制作架构图(2018)
场景
剪切拼接拆条
字幕生产
智能时间线编排
音频处理
图文包装
同屏多轨
转场特效
模板化生产
生产制作服务
生产工具(多端:Web/Mobile/PC)
创作类(如:集锦、拆条)
故
事
板
增强类(如:智能字幕)
Timeline处理中心
AI Timeline
效果编辑
Face OCR Label Pose ASR
DNA Shot Category NLP …..
内容库
音视图文资源库
模版工厂
Manual Timeline
替换类(如:背景替换)
原子AI算法
API
渲染合成
播放器
Preview渲染引擎
直播流
智能剪辑
实时制作
模板库
云制作工程
人物库
标签库
多层视频 多轨混音
智能引擎 特效
版权节目库
镜头库
16. 持续学习与实践中成长
例3: AIGC与视频内容创作 – 从顶层视角看内容创作
创
•
•
意
素 材
门槛高 • 收集难
烧脑 • 挑选难
模版工厂
• 共享难、体积大
剪辑与包装
渲染与合成
• 工具复杂 • 渲染耗时久
• 协作不便 • 并行能力差
内容库 智能时间线编排(基于策略) Timeline处理中心
原子算法(处理素
材) 生产工具 云端渲染合成(可并行)
17. 持续学习与实践中成长
例3: AIGC与视频内容创作 – 已经涌现的AIGC能力
•
最初以原子能力为主,很快出现自动组织编排
多项AIGC能力和传统能力的“类AGI”能力
•
AIGC能力日新月异,迭代速度以天计
18. 总结与展望
例3: AIGC与视频内容创作 – 回归顶层视角
创
•
•
意
素 材
剪辑与包装
渲染与合成
门槛高 • 收集难 • 工具复杂 • 渲染耗时久
烧脑 • 挑选难 • 协作不便 • 并行能力差
模版工厂
ChatGPT:主题详细、概括
AIGC:模版生成
• 共享难、体积大
内容库 智能时间线编排(基于策略) Timeline处理中心
原子算法(处理素
材)
ChatGPT:素材搜索
AIGC:素材生成 生产工具 云端渲染合成(可并行)
AIGC:多种垂直的场景化生成工具
19. 总结与展望
关于架构师的成长与升级
• 抽象思维是最核心的素质,“抽象”要随时随地进行
• 持续学习,乐于尝试新鲜事物,并落地实践
• “升级”体现在多个维度:专业技能、方法论、思考模式等
大模型时代的架构师角色畅想
• 智能化架构设计、安全性与隐私保护设计、创作者版权机制研究、伦理机制研究、精细化架构管理
等
最后想说的
• 人类思维和创造力永无止境
• 架构师的实践经验、洞察力、对复杂业务的理解与沟通不可替代
• AI是架构师的助手,架构师可以借助AI的力量更快促进社会进步与变革
20. Q&A环节