从客户痛点到工程化产品-火山方舟 PromptPilot 落地实践启示录
如果无法正常显示,请先停止浏览器的去广告插件。
1. 从客户痛点到工程化产品:
火山方舟PromptPilot 落地实践启示录
姓名:王铁飞
火山引擎大模型算法工程师
2. AI下半场
AI下半场: 落地落地落地!
大模型商品化
AI服务普及化
场景应用悖论
3. 01 大模型应用落地的挑战
02 火山方舟PromptPilot 的破局之道:痛点驱动的产
品能力与实践路径
03 沉淀与前行:从服务到产品的工程化启示与未来展望
目录
4.
5. 01
大模型应用落地的挑战
6. 大模型应用落地的挑战
清晰表达需求
模型能力边界
上下文动态适应
7. 大模型应用落地的挑战 – 清晰表达需求
用户的需求是 人脑中的意图和评 转化为模型能理解 更强的模型解锁更
场景定制的 估标准有个通过 的具像化目标提示 复杂任务
需求必须由用户 反馈交互 词、评估标准、评 结构化表达
自己来定 逐渐清晰的过程 测用例 更难也更有价值
互动建模:自动为主,互动为辅
8. 大模型应用落地的挑战 – 模型能力边界
大模型应用本质 人工摸索大模型能力 自动化提示词工程 懂上下文
是寻找定制场景的 边界 是一个用户意图 可执行、可验证、
模型能力边界 反复调整 指引的搜索问题 联动训练
提示词过程非常痛苦
核心:自动
9. 大模型应用落地的挑战– 上下文动态适应
大模型应用很多是 大模型的 开放式 开发中、上线后
上下文 都有很多想象不到的
人类高级思维问题 是多样、多变的 Badcase 出现
闭环联动
Badcase的持续检测
评估标准持续迭代
上下文自适应
10. 01 大模型应用落地的挑战
02 火山方舟 PromptPilot 的破局之道:痛点驱动的
产品能力与实践路径
03 沉淀与前行:从服务到产品的工程化启示与未来展望
目录
11. 火山方舟 PromptPilot 的破局之道:痛点驱动的产品能力与实践路径
互动建模:从需求到目标
提示词,数据集
评估标准
自动:从目标到Solution
Tools, Context
Engineering Solution Out
AutoPE Post-train联
动精调
Domain
Studio AI
Engineering
AI 辅助 用户反馈
优化的提示词
场景适配的model
Solution
Badcases 回流
评估集构建
闭环:Badcase 检测
任务定制
Eval Model 评估服务
Run Time Metric
Probe API 自适应
12. PromptPilot 详细揭秘:驱动 AI 进化的能力引擎
Data
Engineering Prompt优化和
联动精调 闭环
Badcase 检测 Solution
数据智擎工坊 Prompt 臻化联动舱 智能闭环・Badcase洞察站 AI方案生成器
互动建模:从需求到目标
自动
联动闭环
General的解决方案
13. PromptPilot 详细揭秘:驱动 AI 进化的能力引擎
问题工程
Question Engineering
Prompt生成
答案工程
上下文工程
Answer Engineering
Answer生成
SOP的生成
知识库辅助Prompt生成
知识库辅助变量生成
(素材内容生成)
模型回答
变量生成 (用户素材或者
问题)
提取标注意图
Context Engineering
自动生成评估
标准
Data Engineering
知识库辅助Answer生成
14. PromptPilot 详细揭秘:驱动 AI 进化的能力引擎
probe API
AutoPE
(自动提示词调优)
联动精调
Solution
闭环:Badcase 检测
Prompt优化和联动精调
feedback API
通过 probe API 对线上task的 badcase 进行 以 project 的概念管理相关 tasks,
闭环处理,结合前两个阶段建立的评估标 并通过feedback API 对线上部署的
准,提供自适应的 badcase 分析与提取服 端到端 project 进行用户反馈(或
务。 应用指标)采集,分析端到端用户
此外,评估标准也会随着生产环境的变化 反馈(或应用指标)与 project中 各
动态演进,确保大模型应用能够持续优化
并具备自适应能力,从而不断提升性能和
个 tasks 性能之间的潜在关系,帮
助用户有针对性地进行性能调优。
视觉理解
视频再创
General
Solution
稳定性。
Prompt 臻化联动舱
智能闭环・Badcase 洞察站
AI 方案生成器
15. 数据智擎工坊:Question Engineering
Prompt 生成
问题:很多用户都有需
求,但是如何把需求转
为提示词呢?尤其是在
2B场景
根据用户的任务描
述生成基础,可用
的 Prompt
16. 数据智擎工坊:Question Engineering
全局反馈+局部反馈,助力用户明确需求
17. 数据智擎工坊:Question Engineering
Prompt 生成:VideoPilot
根据视频,自动分
镜,生成可用的
Prompt
问题:如何获取视觉任务
的提示词?
18. 数据智擎工坊:Question Engineering
变量生成 (用户素材或者问题)
使用方法
模型会根据 Prompt 上下
文信息和变量的含义,生
成变量内容,帮助无数据
的用户验证 Prompt;
变量:对应的就是客户的
问题
1
可以直接点击AI生成
变量内容
2
或者直接粘贴实际的
业务素材
19. 数据智擎工坊:Question Engineering
全集反馈 + 局部反馈, 助力变量生成更准确
增加素材的真实性
增加变量的细节和丰富度
基
于
素
材
内
容
的
局
部
反
馈
如对客户投诉内容,增加处理时间和检测流程等
基
于
素
材
内
容
的
全
局
反
馈
如针对媒体报道,要求增加媒体名称和详尽内容等,看起来更真实
20. 数据智擎工坊:Question Engineering
AI 生成变量(增加 AI Search)
问题 解决方案
在变量内容的生成过程中, 通过增加 AI Search 功能,
有一些是对时效性要求比较
高的场景,通过 AI Search
的方式,尽可能可以补齐时
效性不足的问题,从而辅助
生成更好的素材内容
来辅助生成变量
21. 数据智擎工坊:Answer Engineering
参考答案的生成和校准
问题
解决方案
通过 Answer
用户清晰地表达了需求, Engineering 来构造答
但是对一个问题而言,有 案空间。我们可以通过
正的、负的答案,开放的 多模型来生成多样性的
问题有相对好的、坏的答 答案,客户可以通过对
案,很多时候,其实很难 比,选择,反馈拿到理
给出理想一点的参考答案 想回答
关键词
多模型辅助生成参考答案
全局反馈 局部反馈
22. 数据智擎工坊:Answer Engineering
问题:有了数据集,那么
应该如何评估效果呢?
模型回答:提取标注意图,自动生成评估标准
针对批量的 case 集合,可以直接使用已有的评估标准或者让 LLM 自动生成评估标准,并完成批量打分
小步优化
通过三条反馈数据,即可开启 AI 自动生成评估标准
支持直接输入自定义评估标准
也支持AI自动生成评估
23. 数据智擎工坊:Context Engineering
知识库辅助 Prompt 生成
问题 解决方案
当客户所处场景具有 上线结合知识库的 Prompt 冷
启动方案,通过KB来辅助生成
强领域
专业性
数据
敏感性
业务
定制化
Prompt
典型场景
仅采用大模型自己的知识,容易 比如内容判敏,在什么规则下
造成和业务实际脱节。在这种情 是敏感,什么规则下是不敏感,
况下,必须结合自有知识库才能 需要把客户自己的知识融合到
生成高质量 Prompt Prompt 里
24. 数据智擎工坊: Context Engineering
知识库辅助变量生成
问题 解决方案
如果用户已经有了
一些素材的样例,
需要生成和样例风
格一致的case,怎
么办? 上线结合知识库的
变量生成方案
25. 数据智擎工坊: Context Engineering
知识库辅助 Answer 生成
问题 解决方案
目标场景的问题答
案高度依赖特定知
识库内容,无知识
库支撑时无法形成
有效回答 上线结合知识库的
答案生成方案
26. Prompt 臻化联动舱:Prompt优化 和 联动精调
Prompt 批量优化
基于批量的 case 集合
对 Prompt 进行优化
产生效果更好的 Prompt
27. Prompt 臻化联动舱:Prompt优化 和 联动精调
报告页:查看优化报告
28. Prompt 臻化联动舱:Prompt优化 和 联动精调
视觉理解优化场景
29. Prompt 臻化联动舱:Prompt优化 和 联动精调
多轮优化场景
30. Prompt 臻化联动舱:Prompt优化 和 联动精调
Function call 优化场景
31. Prompt 臻化联动舱:Prompt优化 和 联动精调
Prompt优化支持的模型
当前 PromptPilot 已支持添加任何
model (兼容 api_key 标准协议的)
32. Prompt 臻化联动舱:Prompt优化 和 联动精调
联动精调
在 Prompt 迭代数百轮,PromptPilot 可
以自主判断是否要发起精调
如需精调系统利用空余算力主动发起精调,自
动返回精调前后对比并主动推进下一步部署
33. Prompt 臻化联动舱:Prompt优化 和 联动精调
联动精调
联动精调入口
34. 智能闭环・Badcase洞察站:Badcase 检测
SDK probe
通过SDK使用PromptPilot
为开发者提供了从测试到上线、从评估到调优
的一站式闭环体验,加速 LLM 应用迭代,显著
提升迭代速率,提升用户体验
35. AI方案生成器:Solution
视觉理解 solution
PromptPilot 能够自动判断问题,自动选择模型和工具
85 辆
80-90 辆
72 辆
59 辆
36. AI方案生成器:Solution
VideoPilot: 视频在创
37. PromptPilot 详细揭秘:驱动 AI 进化的能力引擎
PromptPilot:解锁你的专属 AI 能力宝藏
Data Engineering Prompt优化和联动精调 闭环:Badcase 检测 Solution
解锁 解锁 解锁 解锁
清晰的Prompt 一个更高质量的 回流的数据 完备的数据集 prompt 和用户反馈信号, case的理想回答 一个领域自适应的 助力online和offline闭环 评估标准 llm
每个关键词,解锁一个痛点问题
一个解决方案
视觉理解
视频再创
38. PromptPilot让大模型应用落地更容易
释放模型潜能 提升落地效率 降低落地难度
提升模型在业务中落地效果的上限 帮助企业/开发者高效优化Prompt
快速跑通大模型落地流程 帮助业务人员无门槛表达业务逻辑
更好的发挥业务价值
模型上限
业务优化时间从周级 →天级
现在团队
PromptPil
ot
业务/技术人员
PromptPilot
基线表现
传统PE调试
Promptpilot智能调优
过去团队
专业算法团队
39. 01 大模型应用落地的挑战
02 火山方舟 PromptPilot 的破局之道:痛点驱动的
产品能力与实践路径
03 沉淀与前行:从服务到产品的工程化启示与未来展望
目录
40. 沉淀与前行:从服务到产品的工程化启示
如何scaling?
最初仅靠算法同学服务客户,人力与效率受限,难以大规模施展
算法能力。
如何设计产品?
客户需求呈现出多样性与场景化的特点,不同客户姿势各不相同,
那么如何适配各种使用范式
如何确保大家能用起来?
结合前两步,如何让产品真正产生增效
1
2
3
能力规模化的必然选择
唯有通过产品化,将算法能力封装为易用、可复用的产品
形态,才能突破单点服务的局限,实现算法价值的规模化
释放,高效响应更多客户的需求。
以客户为中心的产品设计逻辑
产品设计时,秉持易用性原则,降低客户使用门槛。同时,
要预留灵活的扩展与适配空间,以应对不同客户差异化的落
地路径,确保产品能在多样场景中为客户创造价值。
协同打法的增效价值
结合 FDE的打法,能够在从服务到产品的工程化进程中,
实现各环节资源与能力的更优整合,深度打磨产品、进而
获取更显著的收益
41. 未来展望
深度合作
易用性
效果
围绕建立AI原生应用来构建整套解决方案
共创,深度优化产品
PromptPilot
Post - train
算法迭代、数据闭环、助力大模型潜能持续升级
持续优化,扩展边界
效率
解锁更多的场景和应用
42. 文档和手册
PromptPilot 独立站入口
PromptPilot 用户手册
方舟帮助文档
PromptPilot SDK 文档
https://promptpilot.volcengine.com
https://www.volcengine.com/docs/82379/1399495
https://bytedance.larkoffice.com/docx/R2uPdJmmuoAwq7x3T8Sck1FYnmG
https://www.volcengine.com/docs/82379/1587837
https://bytedance.larkoffice.com/wiki/VtEgwevT6idFcFkeIWjcmtSBnHt
PromptPilot 白皮书
https://bytedance.larkoffice.com/wiki/VtEgwevT6idFcFkeIWjcmtSBn
Ht
43. PromptPilot 面向所有用户全模型兼容全面开放!
PromptPilot 交流群
交流群为大家提供交流平台
请通过微信或企业微信扫码加入
PromptPilot 白皮书
扫码获取电子白皮书
44.
45. THANKS
大模型正在重新定义软件
Large Language Model Is Redefining The Software