阿里云大模型应用落地实践之路
如果无法正常显示,请先停止浏览器的去广告插件。
1. 演讲人:蒋林泉
2.
3.
4.
5.
6. 相对过剩
严重不足
7.
8. 数字人全面上岗,大幅拓展服务带宽,缩短响应时间,提升业务效果
xx HC/年
服务效率 分钟级 到 秒级
- 问答准确率 98%
- 用户渗透率 98.5%
- 月均留存率 57.8%
9. 云智能集团
某IT部门
···
技术内容全球化
技术内容一组
某职能部门
某销售部门
···
···
数据技术部
销售运营部
商机效能中心
···
用户增长
HR共享服务中心
全球人才招聘
组织人才发展部
10.
11. RIDE
不止于Demo与PR,打造“生产可用”并“拿到有效结果”的企业级大模型应用
I dentify
D efine
E xecute
工程-应用与算法
R eorganize
12. “以赛促练”,激发组织提效创新
联动业务部门的AI应用实战,激发业务创新
•
•
•
以赛牵引,推动技术部门与业务部门的深度合作
真实需求牵引,实现效率与效果提升
实战“大模型业务落地体系”,从业务机会识别到产品定义,再到工程落地
100%团队参与的AI提效大赛
•
•
•
AI转型理念宣贯,实践出真知
以赛促练,用AI替代重复性任务,驱动自身研发提效
以身作则,高效的AI先锋技术部门支撑先锋的业务部门
“书同文车同轨” , 全员AI大模型培训认证
大模型 ACP 大模型 ACA
面向技术员工 面向非技术员工
掌握AI应用开发的使用技能 掌握AI应用理解沟通技能
13.
14.
15. XX
XX
16. Language
17. 若岗位可提炼出“关键任务”,如单任务岗位
有效任务总数
=
× 人力成本平均单价
× 人力成本平均单价
人均有效任务数
若岗位不能提炼出“关键任务”,如多任务岗位
=
人类员工HC
×
提效百分比
18. 产
品
定
义
运
营
指
标
19.
20. 产品
业务
目标
Pre-training
Agent
GraphRAG
工程-应用与算法
Multi-modal
MCP A2A MetaGPT
Fine-tuning
工程-数据与评测
SFT
Post-training
Prompt Engineering
RAG Dify
RLHF
MoE
AutoGen
Few Shot
Multi-Agent
21.
22. +
23.
24. 翻译模式
Agent 模 式
第一种 翻译模式,称之为“樱桃”,它相对简单,但要保证原来系统的底子“蛋糕胚”足够好。
第二种 Agent模式,是一个复杂体系。而对于复杂体系,特别重要的一个事情,就是度量。
下面以较复杂的A g e n t 模式为例,讲述整个工程落地的过程
25.
26. - 普通人
- 领域专家
27. •
•
相对标准
绝对标准
•
•
RAGAS 工作原理
归因
28. 原则
实操
•
•
29. 15
业务知识预处理&索引
%
15
用户意图识别&上下文检索
Markdow化 意图识别(拒识、改写)
语义分段 召回(多路召回、粗排)
%
10
用户意图+上下文 大模型总结
%
Prompt(静态/动态模板)
Post-training(SFT、RL)
Meta提取
排序(精排、Re-rank)
完备,准确的业务知识(from 非结构化数据、结构化数据、API)
业务评测 &业务bad case全链路归因分析能力
60 %
30. 一个常被讨论的问题 :
主体:白盒RAG & Context Engineering
什么时候该引入模型训练?什么时候要做SFT,什么时候要搞RL?
要不要搞Pre-training ?
Optional:黑盒训练
31. 被动回答
客户原声
识别话术类型
Query改写 复杂度判断
小模型 小模型
辅助类型识别
ASR
主动引导
32. 业务配置任务
智能外呼
客户原声
翻译
外呼任务配置
控制引擎
销售 LLM
自动化话术测试
ASR
知识回答
TTS
话术质检&标签
通话记录质检
标签自动识别
33. E2E NL2SLQ评测 -> 从 NL 到 数据分析 意图满足 全链路业务归因
领域业务数据,业务口径治理,常见业务分析流SQL建模
34. 【R I D E】
I dentify
Result as a Service
D efine
E xecute
工程-应用与算法
R eorganize
35.
36.
37.
38.