从翻旧账到看烟火,AI 秒看小微“生意实况”
如果无法正常显示,请先停止浏览器的去广告插件。
1. 从翻旧账到看烟火,AI 秒看小微“生意实况”
AI实时互动在网商银行的落地实践
蚂蚁终端体验科技大会
2. 个人介绍
团队:网商银行-体验技术部
花名:鸿蓉(陈文鸿)
工作:负责客户数据网络建设,探索智能交互创新
3. 网商银行介绍
服务小微经营者
累计超6000万
我国首批互联网银行
2015年开业
网商银行
云上银行、没有线下柜台
融资、存款、支付结算、理财
“310”模式
3分钟申请、1分钟放款、0人工干预
4. /00
金融机构如何评估小微经营者?
(获得贷款额度)
5. 材料
风控
KYC/KYB
借款人
授信&定价
金融机构
风控评估
KYC(know-your-customer):在建立业务关系前,了解你的客户。
KYB(know-your-business)
6. 举一个案例
小微经营者申请融资的流程
材料准备
准备
3~5天
企业资料
财务资料
经营证明
贷款用途
处理审核
申请
审核
资产整理
人工审核
1~2周
数据提交
合同
放款
7. 01020304
服务小微面临的困境困境的破局关键技术未来的展望
“看不见”的小微会聊会“看”的小微AI信贷专家AI视频互动,剧本及多智能体AI+
8. /01
我们面临的困境是什么?
9. 典型的「小微经营者」
网商银行的客户画像
小型加工厂
餐饮店
小超市
特征
固定摊贩
流动摊贩
数字化程度低 (大量的资产在线下)
种植户 - 大棚
1.7 亿+
全国小微数量
10. 看得见 :较便利获得数据
服务小微面临的现实挑战
“看不见”的小微
看不见 :难以获得数据
小微经营者数字化程度很低,大量的
资产都在线下:小店、车间、厂房…
数字化程度
小微经营者「能见度」
通常规模越小,数字化程度越低,越难以服务
11. (有能力的金融机构)
传统的「服务范式」
开展个人&企业的信贷申请
线下人工尽调
远程人工尽调
痛点
1
2
线下人工核验
3
4
人工成本 专家经验 效率低下 数据陈旧
12. /02
我们该如何破局?
13. 应对挑战的思考
如何解决?
现
状
理想化方式
需要的能力
传统服务范式:巨大的人员投入,长期的人员培训,低效的尽职调查。
少人最好无人,专家经验统一,高效的尽职调查。
自动化
无人值守
线下材料
线下场景
经营感知
经营识别
14. 这一挑战,在AI时代有了新的「解决思路」
AI实时多模态互动,比肩信贷专家
小微
{
Agent代替人工
音视频采集
AI 自动化 的KYC/KYB
}
多模态理解
授信
15. 产品演示
会聊会“看”的小微AI信贷专家
基础信息
收款信息
线下门店
其他信息
门头招牌
营业执照
就餐区域
16. /03
聊一下关键技术
17. AI信贷专家的实时交互 —“秒看”小微生意实况
整体方案与架构
信贷专家
行
业
分
类
产研 Assistant
发票
招牌门头
收款码
营业执照
化肥
农保险
车间经营 主营产品
种植品类
大棚外景
厂房
食品许可 烟草证
营业执照
土地租赁 合同
合同
发票
全模态理解 Agent
智能抽帧
小微经营者
ASR/TTSVL-LLM语音合成
智能打断编排AI形象
智能降噪FC互动信息
对话轮次
风控 — 授信
18. AI视频交互 — 3个关键点
图
1 「拟人化」的互动剧本设计
图
2 「一镜到底」的主动识别
图
3 「一业一策」的认知大脑
让 AI 智能体 可以用自然、亲切的足够流畅“无门槛”的实现高效识多智能协同组成的“智能产研助
对话方式与小店主交流。别。理”,认知千行百业。
19. 1 「拟人化」的互动剧本设计
LUI对话
对话服务
召回框架
AI Agent
高优FAQ
问答
收款账单如何操作?
Query
动态卡片交互
AI 对话
Query rewrite
意图识别
Context
进入下载账单⻚后,选择账单下载用途为
【用做证明材料】,账单时间选择【自定义
时间】,起始时间为2024-11-20,结束时间
为2025-11-19。确认身份信息即可完成发
送。具体流程可以查看图文引导。
基础知识
情境融合
产品咨询
Qwen Max
/DeepSeek
任务
选项卡片
拍摄卡片
实现流畅对话
…
路由执行
流式对话
避免:“智障”、“已读乱回”
你可以选择以下一项资料补充
银行卡有经营流水
视频理解
发送常用银行卡流水
音频理解
问答反馈
日常用微信收款
发送微信账单
AI工作流剧本
动态&编排
Tools
API
Res
组件
MCP
FC
RAG
20. 2
「一镜到底」的主动识别
近乎“无门槛”、“无感”的操作体验
什么是「一镜到底」?
常规拍摄
VS
一镜到底
怎么做?
为什么要做?目标:把“点按”操作演变成 近乎无感的、无需
操作成本高客户操作的视频交互。
“点按”操作 10+次
向右上移动锁定招牌
理解成本高
即使有一堆的“示例”
后退一点,把招牌全部纳入画面
跟随引导旋转镜头
拍摄经营场所为例
漏损大 18%
要求:需要时刻观察 和 理解视频画面。
后退一点,把招牌全部
21. 2
「一镜到底」的主动识别
技术挑战与实现
技术挑战
室外 帧
一个 1080P 帧率30fps 码率
实现方案
室内 帧
多工作流 + 上下文 + 精准识别
门头 帧
2000kbps 的视频通话,对智能体有
多大压力?
受限 VL 理解速度、token消耗、GPU
资源
快速通道 - 场景
Qwen-QVQ + WS
速度优化:SSIM + VCR
上下文 Memcache
识别通道 - 关键帧 Qwen-VL-MAX + RTC
引导与画面不同步
3MB视觉理解 2s-5s
第 1s 回来时,画面已切到第 N s
降到
300ms
实时互动反馈性能
减少
30s
使用操作时长
达到
60%
服务客户占比
22. 3
「一业一策」的认知大脑
信息检索Agent
研报阅读Agent
视频Agent
画像生成Agent
效果评测Agent
目标&重要性
让 AI "懂行",提供精准、
个性化的服务,提升小微
客户体验。
多智能体协同,构成产研助理,形成认知“千行百业”的大脑
方案
思考力
知识力
browse-use
个体户
websearch
从海量信息源中检索和总结
早餐店
服装店
产业链
RAG
小超市
通信电子
关注区域、就餐区、制作区; 关注货架、商品陈列、收银方式、库存状况;
大棚种植
关注作物、合同、农保;
23. 百万 +36 倍400 +
客户提效种
小微经营者效率提升物体识别
AI实时交互,累计服务小微经营者
从以往的3小时缩短至5分钟内
支持合同、发票、营业执照、店铺门头、餐饮厨
房、就餐区、货架商品等超过400种细粒度物体
24. /04
对未来的展望…
25. 普惠小微客户·个体工商户
(约1.25亿)
小微企业
覆盖更多
识别小微
AI看小微生意
AI+时代,能为工作和生活多添一份美好!
(约6000万)
26. Thanks