蚂蚁集团CIO智能转型助力业务提效的实践
如果无法正常显示,请先停止浏览器的去广告插件。
1. 蚂蚁集团CIO智能转型助力
业务提效的实践
演讲人:杨浩(冀恒)
蚂蚁集团 / 财务智能化技术负责人
2. “AI+财务”,定义财务信息化新阶段
01
目录
“智能财务”实践1:财务智能审核
2.1
“智能财务”实践2:财务智能分析
2.2
总结:LLM应用范式
03
3. “AI+财务”,
定义财务信息化新阶段
4. 财务信息化的趋势和挑战
蚂蚁集团面向未来提出 实时—Real time、按需 新版《会计法》明确要
AI First战略,推动基础 定制—On demand、全 求加强会计信息化建
大模型研究,在ToB、 在线—All online、自助 设。财政部《会计信息
ToC、ToP等领域构建 服务— DIY,以及社交 化发展规划》推动电子
AI能力,助力产业发展 分享—Social,即 凭证、财务共享服务和
ROADS 智能会计工具普及
业务战略
客户体验
行业演进
业财一体化之后,实
时、准确、高质量的数
据生产基础已具备,财
务更多关注运营健康
度、自主感知决策等
自身发展
财务信息化将从线上化、自动化走向智能化阶段!
Gartner发布2025年十
大战略技术趋势,
Agentic AI居首,有望
实现企业提高生产力的
愿望
技术趋势
5. “智能财务”成熟度等级分析
① 智能财务成熟度等级(L1-L4)
② 蚂蚁财务信息化阶段
完成工作,人
负责关键决策
人机协作
机器作为人
的智能助理
以人为主
系统辅助人
完成程式
化、重复性
劳动
多智能体互动
以AI为主
2020~2023年
•
基于AGI技术发展,在知识、推理、逻辑等方面超过人类,图灵测
2016~2019年
试达到财务专家水平;
•
根据财务角色形成多智能体,相互协作完成财务大部分工作,支撑
财务角色转型至运营、分析、决策支持;
•
基于GPT、Bert等深度学习技术,学习财务领域知识&企业财务管
财务2.0:
理规范,构建财务领域大模型,在中级会计、CPA等考试中达到
人类水平;
•
基于财务大模型,构建财务作业、财务知识问答、财务分析、财 财务1.0:
务风险防控、投融资资&筹划等领域的智能Agent,一定条件下独 财务记账时代
立自主工作;
•
基于OCR、RPA等技术替代人工,实现发票、税务申报等场景的
业务系统
自动化;基于机器学习算法从历史数据中学习规律,实现收入预
测、账务分类等;
•
基于规则引擎实现O2C、P2P等领域的管理自动化;
• 以“业财一体”为主要标志,财务各领域作业流程均有系统支持;
• 构建财务数据资产,业务数据、财务数据、税务数据等全链路打
财务3.0:
~2015年
专业财务孵化
业务系统
业财一体化
业务系统
业财服务平台
离线账单层
财务中台体系
账务系统 各财务领域系统
总账系统 总账系统
管
会
体
系
运
营
体
系
总账系统
通,信息标准一致,财务披露报表支持业务明细级别下钻;
蚂蚁具备走向“L3级智能财务”的前提,从2024年开始全面进入数智时代!
——以上分级标准综合国内外多篇相关论文、研究机构的研究结果
6. “智能财务”的三种AI应用范式
AI Embedded模式
Human
AI
AI Native模式
Human
AI
财
会
数
字
员
工
结算核销规则推荐、智能核算方案生成、
智能波动归因等
AI Copilot模式
Human
AI
按子域划分三大财务数字员工:
- 财会数字员工
管
会
数
字
员
工
- 管会数字员工
- 司库数字员工
采购智审插件、报表分析智能助手、结算账
单查询助手、税务助手等
司
库
数
字
员
工
7. “智能财务”架构蓝图
应用层
财会数字员工
管会数字员工
司库数字员工
交互层(LUI)
数字员工运营 对话平台
多智能体系统(MAS)
NL交互 操作处理 文本/卡片 语音生成 自然语言理解 状态追踪 对话策略 动作执行
Agent架构
FaaS
权限管控
流程组织
财务系统群
业务模型层
财务作业模型
数据工程
数据采集 数据建模 数据清洗 数据处理
探索性数据分析
税务风险模型
操作风险模型
数据准备和特征工程
知识抽取
模型训练和微调
数据层
知识工程
知识图谱 知识分析
账务风险模型
知识融合
基础设施层
模型审核和治理 模型推理和服务
MLOps/AIOps
财务决策模型
数据中间层
自动模型再训练
司库管理模型
财务指标工程
数据建模 数据建模 数据清洗
百灵/通义等大模型
数据处理
财务大模型 开源大模型
大模型
8. “智能财务”实践1:
财务智能审核
9. 财务审核的业务痛点和价值
业务价值
业务痛点
管控效果
• 审批工作量过载,审
批工作恐流于形式
• 审核要点多,存在漏
审错审风险
流程管控
不可能三角
业务效率
审核要点覆盖率提
升
审核人力
• 为同时保证业务效
率和管控效果,需
要大量人力进行重
复工作,成本较高
审核准确率提升
人效提升
• 部分流程审核时间拉长,影响业务开展
系统
审批单量
平均每单审批耗时
无人值守率提升
系统A X/年 20min 系统B X/年 5min 系统C X/年 5min 降风险:确保审核点全覆盖,并及时风险预警、拦截
系统D X/年 5min …… …… …… 促提效:提高审批效率效果,助力业务发展
可复用:建设平台能力,应用于财务域多场景
合计X十万审批单/年
**以上所有数据,均为脱敏数据,案例仅供此次演示使用,请勿用作它用。
10. 财务智能审核关键技术
决策
感知
执行
下载文件
三种模
式脚本
RPA采集
自然语言
表格获取
编排脚本
抓取页
面信息
动态指导
RPA执行
决策
下一步
证据链
审批流程控制器
AI Workflow
元素获取
模型思考
审核规则逻辑推理
审核要素提取
智能托管/智能辅助模式
审核结果整理
审核要点管理器 风险审核知识
业务规则对话助手 通用财务审核知识
审核要点prompt 财务审核专家框架
审批节点操作控制
审批节点风险提示
财务域工具
文本化
聊天截图 票据图片
合同文件 PDF
pdf解析器
excel解析器
邮件往来
EXCEL
合约信息
OCR
预算信息
结算信息
审批工单事后抽检
基础
可读文本
大模型底座
财务审核知识微调
模型训练
数据采集/分析器
…
反馈
学习触发
用户反馈
反馈模板
反馈记录
知识学习
知识测评
专家框架BETA
11. 财务智能审核准确率提升与创新结果
阶段一 阶段二
全面诊断、量化归因、优先排序 重点攻克、降低人审
数据分析
确定核心
指标
影响程度
分析
要点错拦
阶段三
解决长尾、强控打标、优化指标统计
工单筛选 原因分析
迭代计划 优化方案
解决部分
长尾问题
待人审率高
迭代计划
优化方案
原因分析
1.金额一致性
2.费用归属日期是
否在合同有效期内
阶段四
提升反馈数
据有效性
指标统计
逻辑优化
打造无人值守样板间
审核策
略建模
流程推
进能力
信息流
类目新
增审核
要点
分阶段稳步治理
核心创新点及收益
财务智能审核基于LLM构建“感知-决策-执行-反馈”的闭环控制系统,特别 财务智能审核经历“辅助审核”、“半自动审核”、“无人值守审核”三个阶段:
是在反馈部分,设计结构化采集+动态清洗/学习/评测+线上灰度的方式,突 - “辅助审核”阶段准确率尚未达到预期目标,以准确率、无待人工介入比例提升为主要
破LLM应用固定Prompt带来的能力迭代缺陷,在财务审核场景实现审核要
点准确率99.9%,系统决策成功率90%+。
目标;
- “半自动审核”阶段,财务智能审核准确率达到一定水平,无错误通过情况发生,在低
风险场景中,财务智审自动推进工单流程,配合定期抽检机制;
- “无人值守审核”阶段,财务智能审核风险扫描范围、审核准确率稳定维持在较高水
位,工单实现自动通过、驳回,达到无人值守目标。
12. “智能财务”实践2:
财务智能分析
13. 财务分析在AI时代的机会和挑战
大模型在数据分析场景的落地应用
决策类应用
生成类应用
看行业: 大模型能力非常契合数据分析发展趋势,数据分析是大模型重要落地场景
对话式交互
报表自动生成
代码/SQL自动生成
分析预警,辅助决策
归因分析,智能决策
衡量标准
数据准确性
固定报表为主,需求交付模式 快速取数为目的,自助分析模式
一阶段
二阶段
业务按需获取,对话式BI模式
结果可读性
洞察自动化
FOR目标用户
公司管理层 FOR运营用户
财务分析岗
支撑经营决策 支持日常作业
三阶段
1. 降低歧义风险,保证数据可靠
2. 减少交互次数,提升一次成功率
1.具备完整系统化能力,降低日常人工投
入
2. 具备财务->业务本质关联和分析能力
14. 财务智能分析-自然语言取数
① 核心问题定义
② 关键技术方案
Embedding模块
请帮我查询集团收入日报2024年3月各天报表项为营业收入的当日值,以折线图绘出
报表/数据资产
提取
集团收入日报
报表(数据集)
报表项
维度
2024年3月各天
时间
营业收入
维值
当日值
指标
折线图
图表类型
数据集
时间区间
报表项
NL2DSL
Question
维值
指标
图表类型
意图识别
算法
向量检索
识别
上月
时间
-
维度
集团
维值
提取
上月集团收入趋势
收入
指标
趋势
图表类型
模糊DSL
LLM
小模型
-
报表(数据集)
向量库
参数提取模块
识别
意图
Embedding
Model
用户感知的回答准确度
模糊匹配
二次确认
精确DSL
执行/展示模块
数据查询
用户首轮得到答案的满足度
数据展示
15. 财务智能分析-模型进化和准确率提升
① 模型进化之路
阶段 1
模型 bailing-10b
模型测评 3 4 5 qwen1.5-7b-base qwen1.5-7b-base-int4 qwen2-1.5b-instruct qwen2.5-3b-instruct qwq-32b
61% 80% 48% 70% 85% 90%+
推理时间 10s 9s 3s 2s 2s 3s
用户体感 准确度极低、慢 准确度提升不大、慢 准确度下降大 准确度不高 正向反馈变多 整体正反馈
1.引入lookahead加速框
架 1. 引入量化模型 1. 切换小参数模型 持续微调 持续微调 持续微调
解法
2
6
② 准确率提升
解法2:对场景枚举训练和评测
解法1:做分级评测
分级
定义
分类
场景
阶段性结果
分级 目标 初版 效果
LV1 标准化场景提问 -> 标准化提问+标准化要素 维度 单维度、多维度 LV1 95%以上 88% 92%
LV2 口语化场景提问 -> 口语化提问+标准化要素 日期 粒度(日/周/月/季/年)、绝对/相对时间 LV2 90% 82% 88%
LV3 模糊化场景提问 -> 口语化提问+口语化要素 意图 趋势/分布/下钻/口径/波动/解读等 LV3 60% 30% 55%
组件 表格/趋势图/饼状图/柱状图/指标卡/文本等 提问 精确/模糊、单轮/多轮、缺省等
注:以上结果指标为内部评测集上的评测结果
16.
17. 总结:LLM应用范式
18. LLM应用范式-选场景
场景分类
输入
输出
场景举例
应用范式
企业级AI应用怎么做?
问答服务类场景 NL NL 智能问答/客服 RAG、Prompt 内容生成类场景 NL Word/Excel/Graph
/Video/Audio 智能取数生成图表/自然语言分析/文档生成 Agent 系统助手类场景 NL Param/Config/SQL
/Code/JSON 智能配置/智能运营/NL2API 内容解读类场景 Word/Excel/Graph/
Video/Audio NL 结算条款识别/税务视同销售/财报解读/基于
文档的问答等 RAG、Prompt 内容转译类场景 Word/Excel/Graph/
Video/Audio Word/Excel/Graph
/Video/Audio 文档生成和解读/税务高新资料/会计政策文
档生成和解读等 RAG、Agent 内容驱动系统类场景 Word/Excel/Graph/
Video/Audio Param/Config/SQL
/Code/JSON 法规条文驱动系统配置/BRD生成系统配置 Agent 生产系统。
系统解读类场景 Param/Config/SQL
/Code/JSON NL 系统问题排查预处理/系统报告解读等 RAG、Prompt ③ 推无人值守。
系统内容生成类场景 Param/Config/SQL
/Code/JSON Word/Excel/Graph
/Video/Audio 系统报告 Agent Param/Config/SQL
/Code/JSON Param/Config/SQL
/Code/JSON 系统配置转译、财务业务接入
系统操作类场景
① 懂领域;
企业真正需要的是定制化、具备
行业 Know-how 的智能体,而
Agent、Prompt
不是一个通用的、容易被大模型
进化所淘汰的方案;
② 进主流程;
真正的价值在于与行业深度结合
的特色模型,要融入企业的核心
AI应用关键评估标准是实际的人
力替代效能。明确替代多少人力
完成闭环工作,这是AI真正有用
Agent
NL:人类自然语言;Word/Excel/Graph/Video/Audio:格式化文档/文件/音视频;Param/Config/SQL/Code/Command:系统参数/配置/代码/指令等
的重要指标。
19. LLM应用范式-定方案
设计:创新交互范式
动态:“感知-决策-执行-反馈”闭环系统
功能解锁、多模态、协作画布等
感知:增加主动感知,识别用户岗位、角色、任
LUI:技能百宝箱、输入框“/”唤起;GUI:两层菜单(上+左)、分级导航
务、环境等上下文信息;
多模态支持:支持直接基于NL/图片/文档进行作业
决策:接入财务知识体系,增强上下文
加速反馈循环:
传统方式依赖赞踩投票、星级评分,LUI创新分享、停留、时效、互动频率
1. 设计
反馈:根据用户反馈数据,结构化后拥有优化专
家框架
可信AI系统:
清晰展示输入和输出的关联、引用具体的内容来源
2. 数据
蚂蚁财务
AI Native
数据:利用AI释放专有数据的价值
自然语言取数(经分): 意图+数据集+时间区间+报表项+维值+指标+图标类型
知识图谱构建和查询(关联交易): 图谱构建和图谱应用
指标工程应用:基于“逻辑建模”构建指标集市,更加灵活的取数/分析
4. 动态
领域专家:财务领域知识模型
3. 领域
专家框架:将领域知识转换为AI应用的workflow
RAG引入领域知识:在推理环节引入知识库,
提升专业度
20. LLM应用范式-搭组织
“财务数字员工”执行委员会
核算域
结算域
税务域
管会域
司库域
交互层
LUI+GUI组件等
月结数字员工 结算作业
核算方案生成 结算风险
…… ……
税务知识库 财务经营分析
税务风险管理 财务指标解读
税务分析 财务波动分析
…… ……
智能资产调度
司库早刊 AI Native基础架构
…… Agent/RAG、知识库等
模型算法
微调/加训、算法应用等
• 执委管总:制定“财务数字员工”战略方针、规划团队、组织项目落地等,把握建设和发展的方向;
• 纵向主战:负责打造各域的“财务数字员工”,包括业务需求对接、能力组合、组织交付,最终交付本领域数字员工;
• 横向主建:负责本能力板块的建设,包括技术调研、能力研发和评测等,以提高能力的适用性和智能化水平,为各域数字员工落地提供能力支撑。
21. 总结
•
“AI+财务”,定义财务信息化新 •
阶段
•
•
蚂蚁“智能财务”实践案例
总结:LLM应用范式
财务信息化的趋势和挑战
“智能财务”成熟度等级分析
“智能财务”的三种AI应用范式
“智能财务”架构蓝图
• 财务智能审核:99.9%的准确
率+80%的业务提效
• 财务智能经分:90%+准确率
的自助经营分析
• LLM应用范式-选场景
• LLM应用范式-定方案
• LLM应用范式-调组织
22. 案例复盘
如果其他同学也在做类似的项目,有哪些“坑点”需要注意?
不要盲目创新:紧扣业务场景,以业务价值为纲,切忌“拿着锤子找钉子”;
做“工具”而非“玩具”:把团队的主要精力放在如何优化准确率等指标上(工程 or 算法),做真正实用的产品,而不要“秀肌肉”;
作为AI应用,以终为始,别在基座模型一定会越来越好的特性上投入战略力量,重点关注领域知识/数据的积累;
如果站在现在的时间点,重做一次这个项目,你会有哪些改变?有哪些思考?
技术方面,在强化学习、领域知识库、数据集市等方面更大/更早的投入,作为垂类模型使其更懂财务领域;
组织方面,在基础架构建设方面,设定机制更好的共享技术基座,促进应用层更快的落地;
23. 以 AI 力为核心引擎,重构企业智能办公生产力新范式!
24.
25. THANKS
探索 AI 应用边界
Explore the limits of AI applications