在变化中抽象不变:技术变局下的架构师升级之想

如果无法正常显示,请先停止浏览器的去广告插件。
分享至:
1. 在变化中抽象不变: 技术变局下的架构师升级之想 阿里云 资深技术专家 / 邹娟
2.
3. 目录 • 引子 • 关于技术变革 • 抽象思维与思考体系 • 举例说明:持续学习与实践中成长 • 总结与展望
4. 引子 Midjourney v1-v5的效果变化 v1 2022.2 v2 2022.4 https://aituts.com/midjourney-versions/ v3 2022.7 v4 2022.11 GPT-1~GPT-4的参数量变化 GPT-1(2018.6) 117 million GPT-3(2020.6) 175 billion GPT-2(2019.2) 1.5 billion GPT-4(2023.3) Estimated to be in trillions v5 2023.3
5. 关于技术变革 本质 科技领域引入新的技术和方法 改变:人们的生活生产方式、 社会结构、文化形态… 促成:社会进步、人类文明发展 与架构师的关系 变 化 架构师的定位 科技领域的专业人士 架构师的职责 设计构建复杂的技术系统、 应用架构 技术变局带来 的挑战与创新 1. 技术趋势的理解 2. 新的架构模式、设计方法 3. 新的技术选型
6. 技术变革 --> 架构师成长:自身竞争力提升 拓宽知识面 新技术躬身入局 促进创新 技术变革带来的新技术、新工具、新平台等都是架构师必须掌握的知识点 技术变革带来的新技术和工具需要架构师自己动手了解、学习、实验。 相对的,可获得更多实践经验和技术洞察力,提升架构师的专业能力 技术变革会带来新的想法、设计思路和解决方案,架构师的创造力得到提升 跨领域能力加强 技术变革往往涉及多领域和多项技术 将促使架构师在不同领域之间思考跨领域技术融合应用的方案 职业发展空间扩大 技术变革会带来新的市场需求和发展机会 这也是架构师扩大职业发展空间的机会
7. 抽象思维:架构师最重要的素质 收集信息、抽丝剥茧、总结归纳、提取共性:在变化中抽象不变 “人们经常问我:未来10 年什么会被改变?我觉 得这个问题很有意思, 也很普通。从来没有人 问我:未来10年,什么 不会变?在零售业,我 们知道客户想要低价, 这一点未来10年不会 变。他们想要更快捷的 配送,他们想要更多的 选择。” 形成抽象的 设计模式和 架构模式 形成通用的 设计原则和 最佳实践 设计灵活, 可扩展,可 维护的技术 架构 抽象思维是架构师最重要的素质之一 从复杂的业务需求和技术需求中抽象出不变的核心 保持对系统演进的敏锐洞察力
8. 抽象思维  建立完整思考体系 提出问题 发现问题 解决问题 技术方案选型 • 公司内部其他团队的类似方案 • 国内公司的类似方案 收集问题 • 海外公司的类似方案 • 技术方案的优势(亮点、竞争 总结问题 力、业务落地性) 技术方案实现 设定解决问题的目标 • 11 • 22 结果反馈
9. 如何进行抽象架构设计 业务 架构 • 确定业务需求 • 定义系统功能和组件 • 架构模式选择 • 系统层次结构设计 • 定义接口和协议 内外双循环 评审 验证 迭代 实现 • 技术栈选择 • 稳定性,安全性 • 性能,成本,灵活性
10. 持续学习与实践中成长 例1: 阿里云视频云AI的架构设计 –- 摸索中演进(2017-2019) 2 3 应用 智能体验馆 内容策划类 内容创作类 智能封面 TTS 视频分镜 4 4 1 原子AI能力 ASR 数 节奏分析 人物识别 主体识别 4 肢体/动作识别 Metadata 体系 Highlight 风格迁移 OCR 视频分割 颜色分析/调色 据 服 务 标签库 人物库 镜头库 内容管理类 场景化视频云智能服务 智能审核 内容理解 智能制作 …… 日 媒资 志 …… 基础元数据 5 全 链 路 监 控 AI 媒体DNA 内容包装类 5 任务调度 剪辑 版权 策略解析
11. 持续学习与实践中成长 例1: 阿里云视频云AI的架构设计 –- 摸索中演进(2017-2019) 阶段 变化的部分 不变的部分(抽象) 若干种AI原子服务 统一的AI任务协议与处理流程 多种场景、AI效果的展示 前端的组件化设计 统一的服务端代理转发服务 多应用服务的实现逻辑 多应用调用AI服务的流程 4 支撑体系设计 内容库多实体、全链路监控 动态元数据、特征值管理体系 全链路统一日志格式 5 场景化AI服务 AI场景服务与适配层 AI服务通用层 1 原子AI服务 2 智能体验馆 3 应用实现
12. 持续学习与实践中成长 例2: 基于通用原子算法实现场景化能力的工程模型设计 智能生产 -- 制作领域 原子视频AI算法 Face1 Face2 Face3 智能生产 内容理解 智能审核 1. 成片 2. 素材 3. 时间线 OCR1 AI服务场景层(适配层) OCR2 4. 直播流 内容理解 -- 媒资领域 Label1 Label2 1. 综合标签 Label3 2. 媒资实体关联 Pose 文件分析 AI结果合并 结果集预处理 智能审核 -- 播控领域 1. 内容审核 AI服务通用层(不变的部分) 工程层多模态:快速适应场景,集众家之长,容灾切换 2. 技术质量检测 3. 内容质量评估
13. 持续学习与实践中成长 例3: AIGC与视频内容创作 明确的 …... 不明确的 时间线编排方式 人工:视频内容创作 智能化:视频内容创作 时间线编排方式 AI检测、识别 AI能力 …... AI生成(AIGC)
14. 抽象思维  建立完整思考体系 提出问题 发现问题 解决问题 技术方案选型 • 公司内部其他团队的类似方案 • 国内公司的类似方案 收集问题 • 海外公司的类似方案 • 技术方案的优势(亮点、竞争 总结问题 力、业务落地性) 技术方案实现 设定解决问题的目标 • 11 • 22 结果反馈
15. 持续学习与实践中成长 例3: AIGC与视频内容创作 – 阿里云智能媒体生产制作架构图(2018) 场景 剪切拼接拆条 字幕生产 智能时间线编排 音频处理 图文包装 同屏多轨 转场特效 模板化生产 生产制作服务 生产工具(多端:Web/Mobile/PC) 创作类(如:集锦、拆条) 故 事 板 增强类(如:智能字幕) Timeline处理中心 AI Timeline 效果编辑 Face OCR Label Pose ASR DNA Shot Category NLP ….. 内容库 音视图文资源库 模版工厂 Manual Timeline 替换类(如:背景替换) 原子AI算法 API 渲染合成 播放器 Preview渲染引擎 直播流 智能剪辑 实时制作 模板库 云制作工程 人物库 标签库 多层视频 多轨混音 智能引擎 特效 版权节目库 镜头库
16. 持续学习与实践中成长 例3: AIGC与视频内容创作 – 从顶层视角看内容创作 创 • • 意 素 材 门槛高 • 收集难 烧脑 • 挑选难 模版工厂 • 共享难、体积大 剪辑与包装 渲染与合成 • 工具复杂 • 渲染耗时久 • 协作不便 • 并行能力差 内容库 智能时间线编排(基于策略) Timeline处理中心 原子算法(处理素 材) 生产工具 云端渲染合成(可并行)
17. 持续学习与实践中成长 例3: AIGC与视频内容创作 – 已经涌现的AIGC能力 • 最初以原子能力为主,很快出现自动组织编排 多项AIGC能力和传统能力的“类AGI”能力 • AIGC能力日新月异,迭代速度以天计
18. 总结与展望 例3: AIGC与视频内容创作 – 回归顶层视角 创 • • 意 素 材 剪辑与包装 渲染与合成 门槛高 • 收集难 • 工具复杂 • 渲染耗时久 烧脑 • 挑选难 • 协作不便 • 并行能力差 模版工厂 ChatGPT:主题详细、概括 AIGC:模版生成 • 共享难、体积大 内容库 智能时间线编排(基于策略) Timeline处理中心 原子算法(处理素 材) ChatGPT:素材搜索 AIGC:素材生成 生产工具 云端渲染合成(可并行) AIGC:多种垂直的场景化生成工具
19. 总结与展望 关于架构师的成长与升级 • 抽象思维是最核心的素质,“抽象”要随时随地进行 • 持续学习,乐于尝试新鲜事物,并落地实践 • “升级”体现在多个维度:专业技能、方法论、思考模式等 大模型时代的架构师角色畅想 • 智能化架构设计、安全性与隐私保护设计、创作者版权机制研究、伦理机制研究、精细化架构管理 等 最后想说的 • 人类思维和创造力永无止境 • 架构师的实践经验、洞察力、对复杂业务的理解与沟通不可替代 • AI是架构师的助手,架构师可以借助AI的力量更快促进社会进步与变革
20. Q&A环节

ホーム - Wiki
Copyright © 2011-2024 iteam. Current version is 2.137.1. UTC+08:00, 2024-11-15 00:37
浙ICP备14020137号-1 $お客様$