从 Copilot 到 Agent AI 编程的范式革新

如果无法正常显示,请先停止浏览器的去广告插件。
分享至:
1. 从 Copilot 到 Agent AI 编程的范式革新 演讲人:丁宇(叔同)
2.
3. AI Coding 是 AI 应用的核心场景 AI Coding 已经成为软件研发的必选项 91% 正在用 AI Coding 61.80% 使用AI编程工具的开发者平均生产 力提高35%​ , 其中​​20%的开发者效率 30% 提升超50% 没有打算 24.40% 计划使用 13.80% 美国 中国 AI编程工具使用占比 全球开发者AI编程工具使用率 AI编程助手对中国开发者覆盖率在30%,中国市场有极大发展空间 数据来源:StackOverflow 来源:IDC发布的一季度中国市场代码生成产品评估
4. 模型能力进步促进 AI Coding 产品演进 应用场景在扩大,产品边界在延伸 模型发展带来产品更多可能性 复杂问题 处理 编程 能力 93.8 ArenaHard 70.7 LiveCodeBench 任务 准确率 61.8 Aider@pass2 上下文 窗口 128 k 高 SDLC 任 务 复 杂 度 低 需求实现 编码任务 研发问答 代码补全 环境信息复杂度 高
5. 场景覆盖:从 Copilot 到 Agent 自主编程 代码补全 代码解释 错误排查 代码评审 原型生成 缺陷修复 需求实现 知识检索 优化建议 单元测试 代码重构 任务规划 架构升级 功能验证 Agent 自主执行 辅助开发 Copilot • 代码片段生成 • 基于任务描述的多文件处理 • 人工触发同步互动 • 自主执行多轮迭代 • 面向代码语言 • 面向自然语言 • 实时伴随 • 异步任务
6. 开发者的工作重心迁移 • 将更多精力投入到整体设计、需求澄清及结果验收,缩短技术实现周期,加速业务迭代循环 • 技术平权,拉高开发者能力基线,初级程序员也具备中级程序员的生产力和技能,但必须要能驾驭 AI 工具 需求承接 结果验收 需求承接 结果验收 技术实现 技术实现
7. 企业落地 AI Coding 最佳实践 从程序员熟悉的工具切入,避免切换 日常开发环境,降低工具替换成本 建立落地的场景路径,先从前端、 数据度量,对于代码采纳率、代码 单测等简单场景,逐步过渡到核心 替代率、需求吞吐率进行度量, 复杂场景 建立正反馈激励机制 构建和改进研发工具链,从「人类 使用文档来记录全局设计和历史 建立企业 AI 编程技巧、规则模板等 友好」到 「AI 友好」,易于被 AI 积累,及时更新文档,构建企业 最佳实践,常态化分享培训,拉齐 工具调用 知识库,形成经验记忆 员工能力水位
8. 通义灵码的演进阶段 通义灵码 Next 通义灵码 2.5 通义灵码 1.0 辅助编码 协同编程 自主编程 人:技术设计、提示和确认 人:任务澄清、干预、结果审查 人:创意、需求澄清、结果验收 代码 任务 需求 人类 AI · 人类 AI 人类 AI ·
9. 通义灵码的产品形态 < / > 插件 轻量化、非侵入 1 生态兼容性 覆盖更多端快速规模化 云端 IDE 获得更多的环境信息 2 操作更多的工具 交互体验的创新 无限资源、无限时间 3 异步化、多任务并行 获得更多的远程信息
10. 通义灵码的能力优势 毫秒级的生成速度 编码时行级/函数级实时续写,编码效率高 恰到好处的生成时机 用户键入和生成时机针对性优化,不等待不打扰 恰如其分的生成长度 根据语法、代码上下文环境智能识别生成长度 贴合代码库的业务场景 支持跨文件上下文感知,生成代码更贴合库上下文
11. 端到端优化是实现优质效果的最短路径 IDE 插件 Lingma IDE • 毫秒级的生成速度:丰富的模型组合、 分级缓存 本 地 服 务 服 务 端 模 型 代码分析 会话管理 上下文感知 代码后处理 向量检索 执行引擎 提示词工程 模型路由 检索增强 意图识别 缓存管理 安全管控 代码补全模型 研发问答模型 企业专属模型 智能体模型 多模态模型 Apply模型 • 恰到好处的生成时机:大量 A/B测试及 自适应的触发策略 • 恰如其分的生成长度:基于语义理解的 自适应生成粒度决策 • 贴合代码库的业务场景:本地检索增强 及工程感知
12. 为不同场景选择不同的模型 全尺寸、全模态、多场景的 Qwen 模型能力,满足 AI Coding 的场景需要 低时延 代码补全的请求量 > 70% 知识问答的请求量 > 20% 专项任务 + 长程任务请求 9 % 专项任务 代码补全 高频 (低成本) 低频 (高成本) 知识问答 长程任务 Chat Agentic 高时延 在时延、吞吐、成本、质量上取得平衡,质量优先
13. 模型调用的优化策略 减少请求 优化策略 最小化Tokens 1. 减少请求:尽可能限制完成任务的必要 请求数;增加缓存 2. 最小化Tokens:降低输入的 Tokens 数, 优化模型输出的 Tokens 数量;控制上下 文长度 更优质的模型 3. 选择更优质的模型:在保持准确率和效 果的情况下,平衡模型的成本和时延
14. 通义千问推出最新 Qwen3 系列 思深,行速,全球最强开源模型 多语言支持,支持 119 种语言和 方言,满足国际应用需求 混合思考模式,根据任务控制 模型进行“思考”的程度 优化模型的 Agent 能力, 加强对 MCP 的支持 提供混合专家 (MoE) 与稠密模型多种尺寸选项 Qwen3-0.6B Qwen3-1.7B Qwen3-4B 预训练数据量提升2倍, 达到约 36 万亿个 token Qwen3-8B Qwen3-14B 结合强化学习的多阶段 后训练策略 Qwen3-32B Qwen3-30B-A3B Qwen3-235B-A22B 模型蒸馏
15. 打造 Lingma 领域专属模型 通过强化学习,打造 代码补全及 NES 模型,采纳率 >35% 开发者行为数据 奖励模型 线上A/B测试 模型迭代 强化学习 代码补全模型 NES 模型 多语言、项目级、高质量 开源代码库 模拟开发者行为,契合开发者编码行为, 学习开发者的习惯偏好。通过 A/B 测试验 证效果,持续迭代 1. 代码编写(项目级) • 自适应粒度代码生成 • 聚合项目信息消除幻觉 2. 代码修改(项目级,多位置) • 类比关联修改 • 多文件关联修改 3. 代码重构(项目级,多位置) • 代码签名重构 • 代码逻辑重构
16. 用户需要什么样的 AI IDE 简单上手易集成 交互创新体验升级;能力水位持续提升;与现有的开发工具外部服务集成,拓展能力边界 模型驱动进化 企业知识学习、工程理解及记忆,懂企业、懂工程、懂用户习惯的 AI Coding 工具
17. 通义灵码新交互:从依赖菜单到基于对话 从传统菜单,变成 Input Box:用户交互依靠对话,开发语言是自然语言 理论上所有的菜单都可以取消,IDE 的交互会走向极简化
18. 对话式的软件研发 每一次对话,就是一次需求迭代 • • • • • • • 创建代码脚手架 迭代新增 feature 完成单元测试 新增前端工程 重构代码 Review 代码 提交代码
19. 简单上手易集成:具备无缝“连接”的能力 面向统一的集成协议,扩展 AI Coding 工具的能力边界 通义灵码 统一 API Model Context Protocol (MCP) Wiki Database GitRepo
20. 模型驱动的进化 工程自动感知 根据开发者的任务描述,自动感 知工程框架、技术栈、所需代码 文件、前后依赖关系等信息,不 需要手动添加工程上下文,任务 描述更轻松
21. 模型驱动的进化 全面完整的工程感知,为模型输入准确上下文 智能问答上下文 IDE 客户端 本 地 服 务 代码分析 代码后处理 会话管理 向量检索 上下文感知 本 地 工 程 模 型 提示词工程 知识管理 代码补全模型 模型路由 扩展管理 专项任务模型 当前代码上下文 检索增强 安全审计 研发问答模型 代码变更 变 变 更 更 队 列 队 列 检 索 服 务 索 引 服 务 向量检索(稠密) 代码全文检索 向量检索(稀疏) 代码图谱检索 向量索引 全文索引 排序筛选 工程信息 执行引擎 变更事件 服 务 端 用户原始提问 代码补全上下文 代码图谱 相 似 代 码 检索结果 聚合去重 相 似 代 码 相 关 代 码 聚合结果 Rerank 排序筛选 Top-K 模型推理
22. 模型驱动的进化 记忆感知 基于大模型的自主记忆能力,在 与开发者的对话中,形成针对开 发者个人、工程和问题的丰富记 忆,越用越懂开发者习惯,提升 协作效率
23. Agentic Coding 当工具带来足够的上下文,模型能力持续提升,Agentic Coding 将爆发式增长 完成从 Copilot 到 Agent 的编程范式革新 自然语言 自主能力 学习适应 更长的上下文 更便宜的 Tokens 辅助专项任务 自然语言编程 感知能力 单一任务 复杂任务 决策能力 智能体系统 工程 Multi-Edit 供码补全 目标导向 工具使用 符号语言
24. 打造 Lingma 专属智能体模型 通过强化学习,打造 专属 软件工程智能体大模型 用户标注反馈 模型迭代 用户采纳行为 项目环境执行反馈 • 收集海量开源项目代码库,作为 任务场景 Agent Reinforcement Learning A/B 测试 反馈飞轮 灵码 Agent 模型 融合用户行为反馈飞轮 • 工具使用 数据仓库 沙箱环境 • 训练数据; 充分利用真实大型项目的各类复 杂需求、思考过程、工具交互、 开发行为,进行大模型强化学习 训练,提高模型解决方案探索的 准确率和效率; 最终让模型探索出,解决复杂问 题的规划和代码生成能力
25. Agentic Coding 工作流 人们根据需要或认为必要,可以在多个节点进行人工干预和审查 自然语言输入 理解和推理 生成任务计划 自主编码及试错 迭代学习和纠偏 确认输出结果
26. Agentic Coding 的最佳实践 给 AI 更多的上下文以及工具;给人类更多的确定性结果
27. AI Coding 工具在企业落地的挑战 在统一管控、安全合规以及企业运营,都面临较大挑战 统一管控 安全合规 数据化运营 企业级账号、许可及权限管理, 让企业级服务管理更便捷 全方位加密、网络和安全策略,助 力企业构建安全、合规的研发环境 在企业内部快速落地,能够清晰地 衡量实际的收益和效果 多种账号身份集成 全程数据加密和防护 企业落地推广最佳实践 统一许可授权 专属 VPC 实例部署 自定义个性化模板 精细化权限管理 网络白名单管理 数据看板
28. 数据跨境以及安全风险 在效率和安全之间达成一个平衡 合规风险: 企业面临数据合规及隐私要求, 限制核心数据不跨境 THE RISKS OF AI- GENERATED CODE 漏洞: 自动代码生成可能会无意中引入漏洞, 例如弱加密、注入攻击或意外的访问点 对抗性攻击: 攻击者可能会使用对抗性技术 操纵 AI 生成的代码,从而导致安全漏洞或漏 洞利用
29. 零信任前提下的部署方案 企业内网 灵 码 服 务 IDE 编码助手 企业SSO登录 专线连接 模型路由 身份管理 知识管理 扩展管理 安全过滤 模型推理服务 安全过滤 企业专属模型 知识管理 数据库 推理 代码、文档向量数据库 公共推理集群 通义百炼 模型 整洁 模型推理服务 模型推理服务 代码补全模型 研发问答模型 混合 数据集管理 模型训练平台 企 业 专 属 专属推理集群 VPN接入 数据清洗服务 提示词工程
30. 代码安全及隐私保障 全程数据加密 基于 https 加密传输,支持身份鉴 权、内容安全防护,全程保护数据 安全 通义灵码插件 不存储、不进行二次训练 开源合规的训练数据 代码上下文仅用于模型推理,全过程 数据不落盘,不会使用你的代码和数 据进行二次训练 基于通义大模型进行编码领域针对性 训练,所有用于训练的代码数据均为 开源合规数据 通义灵码本地客户端 服务和模型推理 此过程代码数据不落盘,不会用于二次训练 可配置的预处理 https 可配置的后处理 安全滤网 内容加密 API 模型推理 返回客户端
31.
32. THANKS 探索 AI 应用边界 Explore the limits of AI applications

首页 - Wiki
Copyright © 2011-2025 iteam. Current version is 2.146.0. UTC+08:00, 2025-10-19 01:12
浙ICP备14020137号-1 $访客地图$