AI 编程颠覆 IT 生产力

如果无法正常显示,请先停止浏览器的去广告插件。
分享至:
1. AI 编程颠覆 IT 生产力 丁宇 阿里云云原生应用平台负责人
2.
3. 云原生应用架构演进 企业级应用架构 互联网分布式架构 单体应用 微服务 Serverless 架构 服务化 / 模块化 / 免运维
4. 云原生技术带来生产力飞跃 企业对技术红利的追求是无止境的 程序员产能和软件研发效率成为企业竞争发展的瓶颈之一 设计、研发侧过去十多年没有发生根本性变化,如何提效? 应用研发 生命周期 业务 需求 产品 需求 设计 容器化编排调度、分时复用弹性伸缩、混合部署,提升了企业资源效率 容器化上云、 K8s 化管理、Serverless 化架构,提升了企业运维效率 微服务、容器化、DevOps、GitOps、IaC,提升了企业交付效率 开发 + 自测 设计 开发 集成 + 验证 灰度 + 生产发布 交付运维 线上运维
5. AI 时代:数据、计算与模型协同发展,知识触手可及 先验 知识 算法创新与突破,从数据中抽取 知识 逻辑 推理 伦理 语言 理解 认知 艺术 物理 医学 哲学 金融 持续演进的 模型技术 爆炸性增长的 数据 不断提升的 计算能力 法律 农业
6. 编程成为最高频的 AI 应用场景 Category Breakdown of 4,098 ChatGPT Prompts (Analysis of unique users’ single and multi-prompt sessions from May & June, 2023) Politics & Nonprofit 3% Personal & Other 10% Sales & Marketing 13% Programming, 29.14, 29% 大模型带来了 AI 应用的井喷,在各种落 地场景中,最高频刚需的是什么? Datos 针对 2023 年 5-6 月 ChatGPT 用户使用情况做了分析,其中编程以 29% 占比高居榜首 Content 21% Education 23% AI 成为提升软件研发效率的必选项
7. 程序员的时间分配情况 程序员 2/3 的工作时间直接跟代码相关 32% 程序员 IDE 使用排行 23% 编写代码和改进已有代码 39% Visual Studio Code 33% IntelliJ 会议,管理和运营 29% Visual Studio 23% PyCharm 19% Eclipse Andriod Studio 19% 代码维护 12% 测试 4% 9% 其他 响应安全问题 程序员花费三分之一的时间编写新代码或改进现有代码(32%)。花费 35% 的时间来管理代码,包括代码维护 (19%)、测试(12%)和响应安全问题(4%)。另外 23% 的时间花在会议以及管理和运营任务上 程序员的时间分配:https://thenewstack.io/how-much-time-do-developers-spend-actually-writing-code/ IPython / Jupyter 9% Vim 9% Sublime Text … 12% 8% PHP Storm 4% XCode 3% Coda 3% Atom 2% Emacs 1% 0% 13% 25% 38% 50% 63% IDE数据来自《中国开发者现状调查》:https://www.199it.com/archives/1405936.html
8. LLM 带来新的人机协同模式 LLM as Copilot LLM as Agent 阶段一 阶段二 辅助完成任务 • 不改变软件工程专业分工,增强领域专 业技术,AI研发工具辅助人完成任务 工具 人 赋能人员提效 主导、提示及确认 LLM as Multi-Agents 阶段三 自主完成任务 • 单一职能专家,能够自主使用工具完成预 定任务 工具 人 独立完成工作 给定上下文,完成知识对齐 协同处理复杂任务 • 影响整个软件研发过程,多Agent互相 协作完成复杂工作 工具 人 与人协同共生 负责创意、纠偏及确认
9. 产品实现路径三阶段 代码 辅助生成 任务 自主处理 功能 自主研发 Copilot 阶段 Agent 阶段 Multi-Agent 阶段 通义灵码, GitHub Copilot 通义灵码,Devin, Copilot Workspace AI 程序员, Devin
10. 通义灵码 , 你的智能编码助手 • 通义灵码是基于通义大模型实现的智能编码助手,提供代码智能生成、研发智能问答等能力,帮助程序员更高效的写代码 • 支持 Java、Python、Go、C/C++、C#、JavaScript、TypeScript、PHP、Rust、Scala 等 200 多种编程语言 • 支持 Visual Studio Code、JetBrains IDEs 等主流 IDE 及远程开发模式,兼容 Windows 7 以上/MacOS/ Linux 操作系统。 通义灵码致力于 帮助开发者编码提效 100%,帮助企业研发提效 50% 沉浸式编码 IDE端内即可满足编码场景中的技 术资料检索、技术难题解答诉求, 打造沉浸式编码体验 贴合代码库场景 阿里云使用场景友好 安全、可控 客户端和模型层同步优化针对代 码跨文件上下文感知能力,生成 代码更加贴合当前场景 针对阿里云的云服务使用、 SDK/OpenAPI 使用等场景调 优,代码生成、智能问答对阿里 云的云服务使用场景更友好 加密传输,并支持身份鉴权、内 容安全防护等,代码数据仅用于 推理,不会进行二次训练,全方 位保障数据安全
11. 基于阿里云 MaaS 产品体系构建 通义垂直领域产品 通义灵码 通义效率 通义星尘 通义晓蜜 …… 模型定制与应用服务 阿里云百炼 模型矩阵 千问大语言模型 通义万相 三方开源&商业模型 魔搭社区 模型推理 模型训练 (PAI灵积) (PAI灵骏) 阿里云飞天操作系统
12. 优秀的模型能力,通义灵码多项模型指标领先 1)公开数据集评测结果中,通义灵码的代 码生成模型多项指标领先于友商 2)72B模型,使用超过3万亿tokens的数据 进行预训练,在多个中英文评测中,显著超 过友商模型,并且稳定支持32K上下文
13. 通义灵码的功能架构 • 生成粒度 IDE 客户端 • 触发时机 … 本地服务 服务端 模型 数据 算力 分码分析 上下文感知 本地 RAG 代码后处理 问答会话管理 向量数据库 • 业务上下文感知 Agent 框架 本地工具 短期记忆 身份鉴权 提示词工程 企业级 RAG 生成问答对话 模型路由 向量数据库 代码补全模型 数据采集 研发问答模型 数据清洗 GPU 算力池 企业专属模型 数据标注 模型训练SFT 数据解析 算力运维 • 多模型路由 • 扩展集成 • 上下文增长 • MoE 模型 Embedding 效果评测 • 精细化数据处理 • 面向任务的数据集 • 面向能力的数据集
14. 通义灵码使用场景 代码实时续写 单元测试生成 代码注释生成 研发领域自由问答 异常报错智能排查 根据当前语法和跨文件代码 根据JUnit、Mockito、 一键生成方法注释及行间 研发领域知识问答,快速 一键启动报错排查的智能答 上下文,实时生成行/函数 Spring Test、unit test等框 注释 获得答案和解决思路 疑,快速反馈排查思路或修 建议代码 架生成单元测试 研发领域模型定制 核心编码场景覆盖 复建议代码 环境感知代码生成 为开发者体验设计
15. 通义灵码功能演示:代码续写 代码续写 单元测试生成 调试问题排查
16. 通义灵码功能演示:单元测试生成 代码续写 单元测试生成 调试问题排查
17. 通义灵码功能演示:调试问题排查 代码续写 单元测试生成 调试问题排查
18. 通义灵码四大优势 毫秒 级的 生成 编码时行级/函数级实时续写,编码效率高 速度 恰到好处的生成时机 用户键入和生成时机针对性优化,不等待不打扰 恰如其分的生成长度 根据语法、代码上下文环境智能化识别生成长度 贴合代码库的业务场景 支持跨文件上下文感知,生成代码更贴合代码库上下文
19. 125.00% 毫秒级的生成速度:分级缓存、丰富的模型组合 100.00% 流式补全 IDE 客户端 分码分析 代码后处理 代码补全任务是时延敏感型任务,使用专门训练的小参 数代码模型,平衡代码生成效率与质量 75.00% 会话管理 代码补全任务 CodeQwen2 模型 本地缓存 73.00% 问答管理 在中等参数模型下,提供代码解释、注释生成、单元测 试、代码优化、运行错误修复、提交信息生成、重构建议 等7项代码技能 50.00% 服务端缓存 身份鉴权 提示词工程 代码专项任务 Qwen-Plus 模型 生成问答对话 25.00% 模型路由 推理缓存 6.36% 20.6… 代码补全模型 专项任务模型 研发问答模型 0.00% 调用量 研发问答对模型知识面、编程能力、推理能力有更高 要求。需要最大参数模型并叠加RAG技术,消除模型 幻觉,提升回答质量 研发自由问答 Qwen-Max 模型
20. 恰到好处的生成时机:自适应的触发策略 IDE 客户端 …. 代码后处理 上下文解析 历史行为特征 速度及位置 上下文及关键字 用户习惯学习 会话管理 触发 策略 问答管理 提示词工程 生成问答对话 模型路由 参数调整 参数调整 用户 研究 埋点 分析 触发及延迟 身份鉴权 分码分析 用户键盘输入 代码 展示 代码补全模型 专项任务模型 问答模型 针对不同的端,对用户行为进行持续学习、优化触发策略,符合开发者的使用习惯
21. 恰如其分的生成长度:基于语义理解的自适应生成粒度决策 问题 • 生成单行代码:无法构建完整的函数或模块 • 代码块的不同提供不同生成规则:准确度低 通义灵码基于代码的语义信息,充分让模型理解不同场 景下所需的生成粒度,从而让模型能够根据当前正在编 写的代码位置,自适应决策应该生成的代码粒度 决策准确率显著提升: Java 语言: 47%提升到56% Python 语言:26%提升到44%
22. 贴合代码库的业务场景:基于库内感知的代码生成及问答 当前代码上下文 构建 Prompt 模型生成 IDE 客户端 “ 幻觉”问题 索引 会话管理 上下文感知 分码分析 问答管理 代码后处理 代码引用选择模型 身份鉴权 生成问答对话 提示词工程 Top N代码引用 相似代码 模型路由 构建 Prompt 代码补全模型 专项任务模型 研发问答模型 库内跨文件感知评测集中, 准确率从 22% 提高到 66.9% 模型生成 当前代码上下文
23. 贴合代码库的业务场景:本地库内检索增强 • 通过感知本地工作空间中的源文件进行预处理,建立用户本地的向量化索引,基于 • IDE 客户端 本地工作流编排,完成多阶段任务 用户的代码都存在本地,保障用户代码安全和隐私 知识问答 索引 会话管理 上下文感知 本地 RAG 分码分析 问答管理 代码后处理 向量数据库 需求细化 代码库信息获取 需求关键信息提取 库内检索增强 本地向量检索召回 检索结果合并及重排 需求任务拆解 身份鉴权 提示词工程 生成问答对话 模型路由 专项任务模型 代码补全模型 企业知识库检索召回 大模型生成 研发问答模型 本地检索引擎 组装 Prompt 本地向量存储引擎 远程 Embedding 发送请求 本地工作流编排架构
24. 企业级 RAG:贴合企业及行业经验 企业管理 插件调用 企业管理后台 灵码远程服务 IDE 客户端 索引 分码分析 会话管理 问答管理 上下文感知 代码后处理 成员管理 知识库管理 OpenAPI Prompt 管理 洞察数据 审计日志 代码补全 对话问答 库内 RAG 向量数据库 知识库管理服务 身份鉴权 提示词工程 企业级 RAG 生成问答对话 模型路由 向量数据库 数据解析调度 文 件 服 务 结构化解析 数据分块 问题理解 整理回答 初步召回 二轮召回重排 代码/文档向量化 代码补全模型 专项任务模型 研发问答模型 企业专属模型 模型训练SFT Embedding 模型推理服务 LLM Embedding 向量服务 检索引擎 向量存储
25. 整个工程级的任务辅助(1/3) 从理解一个文件 到理解整个工程
26. 整个工程级的任务辅助(2/3) 在整个工程中 查询相关的代码实现
27. 整个工程级的任务辅助(3/3) 在整个工程中辅助 生成相关业务代码
28. 企业为什么需要通义灵码 ChatGPT 海外 Copilot 产品 开源自建 通义灵码 境内无法顺畅访问 不支持用户及企业自有技术框架 缺少工程 Know How,知易行难 有端到端的产品技术优势,提供低延时、 高质量的代码服务 无法定制和调优,完全依靠用户的专业知 识和技能进行 prompt 不支持领域特定语言,不支持私有 API 以及开发规范 模型训练成本高,缺乏专业训练能力, 无法定制和调优 企业私域数据语料 RAG 和 SFT 能力,满 足企业个性化需求。中文语义理解能力表 现更优秀 模型部署在境外 不支私有化建设 本地部署,算力成本高 超强的算力资源和模型能力:阿里云开源 国内迄今为止最大的模型,在模型能力上 有很好的优势 数据出境,存在数据安全合规风险 数据出境,存在数据安全合规风险 无专业的安全运维团队,对安全 Patch 无 法长期跟进升级 严格的安全隐私保护,全链路加密、代码 不落盘,不对用户数据进行二次训练
29. 通义灵码显著提升开发者工作效率 通义灵码对工作效率和专注度提升的影响 1分 不同意 感觉编码工作效率更高 3% 4% 2分 3分 20% 26% 4分 5分 46% 非常同意 平均分 4.11 / 5.00 4.28 / 5.00 可以保持编码心流 可以减少重复代码的编写 4% 4% 3% 3% 21% 17% 25% 27% 46% 50% 4.16 / 5.00 4.09 / 5.00 3.95 / 5.00 可以减少浏览器搜索次数 3% 3% 17% 26% 51% 当我们深入研究开发人员使用 通义灵码 的效果时,从1124份有效问卷中得出: • 编码工作效率提高:72.51% 的受访者给出了4分以上 • 保持心流工作状态:80.46% 的受访者给出了4分以上 • 减少重复代码的编写:76.87%的受访者给出了4分以上 3.94 / 5.00
30. 通义灵码阶段性进展 主流 IDE … 问答意图识别 用户习惯学习 跨文件感知强化 代码补全模型 海量中/英技术文档 亿万开源代码数据 插件下载量 Prompt 封装 加密传输 用户鉴权 每日推荐代码 内容安全防护 研发问答模型 通用研发知识 通义大模型 阿里云云服务文档 阿里云 SDK/API 采纳代码行数 百万开发者规模,企业客户数超 10000 家,国内同类产品用户数第一 AI 代码生成占比
31. 通义灵码4月入职阿里云 阿里云是国内首家推行全员 AI 编码的云厂商 周活跃开发者占比 辅助研发提效 AI 代码生成占比 通义灵码5月入职中华财险 中华财险积极拥抱云 + AI 技术人员使用占比 通义灵码应用于内部代码研发场景,提升开发效能 问答准确率 AI 代码生成占比
32. 产品实现路径三阶段 代码 辅助生成 任务 自主处理 功能 自主研发 Copilot 阶段 Agent 阶段 Multi-Agent 阶段 通义灵码, GitHub Copilot 通义灵码,Devin, Copilot Workspace AI 程序员, Devin
33. 研发领域多智能体协同模式 产品经理 Agent 架构师 Agent 项目经理 Agent 工程师 Agent 测试 Agent 细化需求 需求澄清 细分任务 生成代码 生成单测 用户故事 领域模型 任务优先级 代码评审 单测执行 需求优先级 API 时序流 任务约束 修复缺陷 收集缺陷 … … … … … 用 户 需 求 运行环境 全局知识/工具 企业私域检索 开放域检索 企业 API 调用 功能需求 公共消息队列 工具调用 知识查询 消息1 消息2 … 待完成任务 消息来源:项目经理 Agent 消息目标:开发工程师 消息内容:任务1:实现模块 人工干预:React or Vue 信息提取 架构设计 代码工程信息
34. 研发领域多智能体概念架构 • 结构化任务管理:多智能体的工作模式反映了 人类团队如何分解大型任务,提供一种分配任 务和管理智能体的直接方法 • 简化工作流程:将复杂的任务分解为更小的子 任务使整个项目更易于管理,提高灵活性和适 应性,符合企业特点和需要 • 高效执行任务:让某个具体的智能体专注于特 定任务。每个智能体能够专注地分析并执行任 务,提高系统工作效率
35. 研发领域多智能体功能架构 DevOps IDE 客户端 … 本地服务 分码分析 索引 本地 RAG 代码后处理 上下文感知 向量数据库 Agent框架 本地工具 短期记忆 Issue IM Git Repo 工作区 CI/CD 工作区 会话管理 Multi-Agent 上下文管理 身份鉴权 提示词工程 RAG 沙盒 Agent Plan 生成问答对话 模型路由 向量数据库 工具 长期记忆 模型 代码补全模型 研发问答模型 企业专属模型 数据 数据采集 服务端 算力 数据清洗 GPU 算力池 数据标注 模型训练SFT 数据解析 Embedding 效果评测 算力运维
36.
37.

Home - Wiki
Copyright © 2011-2024 iteam. Current version is 2.139.0. UTC+08:00, 2024-12-24 11:18
浙ICP备14020137号-1 $Map of visitor$