大模型时代生产力工具转型的技术探索

1. 大模型时代—— 生产力工具转型的技术探索商汤科技AIGC研究与应用团队负责人詹明捷

2. 人工智能新范式（AGI）已经到来 AI AI +场景应用 AI 新范式（AGI）有人类反馈的强化学习超大模型 1980 Prolog s & Lisp 1990 s 机器学习算法 2012 2022 互联网娱乐专家系统解答特定领域的问题智能手机智慧城市智慧医疗自动驾驶 CNN夺得ImageNet第一 PaLM-E 具象化多模态语言大模型 DALL-E 2 由文字生成高清原创图像 Stable Diffusion 使用消费级显卡获取文本驱动的图像 ChatGPT发布可理解人类语言并生成类似人类的书面文本内容正确率超越第二名近10% 突破工业红线高效的通用智能 GPT-4 提供完全不同可能性的多模态模型

3. 大模型使能的AGI与传统AI处理任务对比零样本多模态思维链（Zero-shot Multimodal Chain-of-Thought） AI AGI 明确任务明确任务明确任务物体检测文字识别做决策 Object Detection OCR 我们一步步思考给定图片 Q: 这个图标是什么意思? 我们应该做什么？是否要减速？是 • AGI • • • • • 30 km/h 100m 小孩学校区域前方100米有一所学校你需要小心小孩，并将车速降低到30 km/h以下

4. 大模型核心能力更高算力庞大训练数据千卡起步，GPT4 万卡干净、多维、海量的数据数据算力大模型模型算法工程化能力有效的Chain-of-thoughts 架构设计、分布式训练等算法工程化

5. LLM技术路线演化，GPT类模型处于领先 ChatGPT等语言模型发展历程（进化树）大模型关键技术路径 • Encoder类模型（以BERT为代表）在过去的方案中经过fine-tune性能会更强。OpenAI也是坚持自身以生成式任务为目标的技术理想，终于实现突破 • 随着考察任务的变化，现在大模型更关注zero- shot的文本生成能力（更贴近AGI），Decoder- Only类模型（以ChatGPT为代表的）更方便利用海量的无监督文本数据进行训练 • Decoder-Only类模型结构效率更高，OpenAI以系统工程的角度看待训练，着重训练效率，坚持此路线 Encoder-Decoder or Encoder-Only (BERT类) • 训练：Masked Language Models • 模型类别：Discriminative • 预训练任务：Predict masked words Decoder-Only (GPT类) • 训练：Autoregressive Language Models • 模型类别：Generative • 预训练任务：Predict next word 信息来源：The Practical Guides for Large Language Models • 如今大模型训练成本极高，由于历史原因，各企业组织（如Google）存在路径依赖，大多沿用自身已经验证通过的路线。

6. 近几年NLP大事件用好数据大模型 ChatGPT (OpenAI) GPT3 (OpenAI) llama2 (meta) PALM (Google) Galactica (Meta) Megatron-LM (Nvidia) RETRO (DeepMind) Turing (Microsoft) WebGPT (OpenAI) GLM-130B (清华) Flan-PALM (Google) 盘古 (华为) T0 (huggingface) ERNIE 3.0 (百度)

7. 什么是思维链？思维链激发语言模型解锁更强的能力，解锁更复杂的推理任务，右侧图绿色部分为思维链

8. 多任务训练

9. 指令微调

10. 收益分析

11. 编程工具的发展史打孔卡片编程语言 AI是生产生产力工具的工具 AI FOR AI 生成式AI

12. 下一代软件开发范式：AI FOR AI 人工智能大模型智能化、模块坏、标准化的AI生产工具开发智能化流程标准化工具模块化 AI辅助开发、一键调度大算力、数据驱动、快速部署

13. 软件开发不同角色：分析师、程序员和测试员分析师：分析师的目标是制定高层次的 plan 并专注于指导程序员编写程序，而不是深入研究实现细节。给定需求X，分析师将分解为几个易于解决的子任务，以方便程序员直接实施，并制定概述实施主要步骤的 plan。程序员：作为该团队的核心角色，程序员将在整个开发过程中接收来自分析师的 plan 或来自测试人员的测试报告。将两项主要职责分配给程序员：1. 编写满足指定要求的代码，遵守分析师提供的 plan。2. 修复或细化代码，考虑到测试人员反馈的测试报告反馈。测试员：测试人员获取程序员编写的代码，随后记录包含各个方面的测试报告，例如功能性、可读性和可维护性。与直接生成测试用例相比，生成测试报告更符合语言模型的倾向。

14. 自动Debug

15. 自动Debug

16. 新二八定律：代码 = 80% AI 生成 + 20% 人工

17. 新二八定律：代码 = 80% AI 生成 + 20% 人工

18. “新二八定律”带来软件开发新体验软件应用人类诉求需求输入需求描述自然语言 & 行为编程语言人机界面库/ 工具/ 框架操作系统大模型 (基础) 语言与操作系统，是当前人类与世界知识交互的核心媒介依赖: • 人类需求的表达/生成方式将发生变化。➡️ 上层行业应用创新 ➡️ 主流行业应用都可以被重新做一遍 • 人类需求被满足的方式和底层依赖发生变化。➡️ 底层编程逻辑变革 + 工具 & 插件

19.

20. 业界持续推出生成式AI技术延展 Auto-GPT Plugins Code Interpreter CoT Function Calling MOE …

21. 延展：用代码解决视觉问题

22. 延展：基于多仓库融合的代码生成

23. 延展：基于代码解决数学题

24. THANKS 如果您有兴趣进一步了解商汤AI代码助手，可联系： sensecode@sensetime.com