彭垚-视频智能中台打造AI产品的钢筋混凝土时代

如果无法正常显示,请先停止浏览器的去广告插件。
分享至:
1. 视频智能中台打造AI产品的钢筋混凝土时代 演讲人 闪马智能创始人兼CEO 彭垚
2. 截至当前,全国摄像头数量 已超过 200,000,000 台 然而,每日产生的视频数据 利用率仅不足 1% 或许,我们应该重新思考 如何发挥视频的价值 升维视频AI分析能力 让视频真正为人服务 视频正成为人类最直接、最主要的交互方式,数亿计的摄 像头和手机都在实时记录着发生在社会中的每件事情。 为了最大程度利用每一秒视频,闪马智能倾力打造了 「VisionMind 视界心」系统,化所见为所知,看见城市 中每个微小的异常,预知每个潜在的风险,为人类构建真 正安全、文明、美好的社会。
3. 团队历程 2016 创始人彭垚、林亦宁开创七牛AI实验室,组 建深度学习团队,主导研究和开发工作 2017 7 月 发布面向图片视频的深度学习平台,实 现模型生产自动化、流水线化 10 月 ACMMM LSVC 竞赛亚军 闪马智能成立于2019年,前身是“七牛 云人工智能实验室”。依托七牛海量视 频数据,闪马智能专注“视频异常分 析”和视频分析之上的大数据,变革人 2018 2019 类使用视频的方式,帮助人们利用海量 6 月 ActivityNet 竞赛季军 2 月 闪马智能成立 视频发现异常并解决社会问题。 9 月 复旦-七牛联合实验室成立 4 月 发布智能视频异常分析平台 参与举办世界人工智能大会 11 月 荣获“首届进博会网络安保贡献奖” 12 月 入选《上海人工智能创新产品名录》 参与 2019 外滩、豫园跨年安保工作 参与上海非机动车治理行动 8 月 获得 5800 万天使轮融资 非机动车治理项目入选CSDN AI TOP 30案例 9 月 获得 5800 万元天使轮融资 入驻华为HoloSens Store成为首批算法合作伙伴 11 月 与电科智能联合研发守卫者Guardian系列边缘计 算节点
4. 产品应用 应用领域 应用平台 AI 分析引擎 城市交通 城市治理 岗位管理 城市大客流管理 互联网内容安全 智能违法抓拍识别 违章信息告警 操作规范 客流量管理 鉴黄 违法时空分析 违章内容上报 仓库管理 客流密度管理 鉴恐 两“快”建档 违章高发路段警力调度 服务窗口 人群事件告警 鉴政 机动车 违法识别 非机动车 违法识别 特种车辆 违章识别 特种流量 行为分析 不按导向行驶 机占非 车辆路线违规认责 路段违章统计 行为分析类 通用分析类 无人在岗识别 抽烟识别 客流量识别 人群异常 事件识别 路段违章统计 打架斗殴事件 大弯小转 逆向行驶 未覆盖渣土车识别 重点路口信息统计 打架斗殴识别 睡觉玩手机识别 重点路口信息统计 人群突然散开 不礼让行人 闯禁令 车辆未注册认责 特种车辆行经路段 人员进入识别 违规着装识别 特种车辆行经路段 拉横幅示威 违规内容 识别 违规风险 处置 鉴黄 数量统计 鉴暴恐 鉴政治敏感 鉴非法广告 算法调度与负载均衡 基础支撑 云计算平台、大数据平台、深度学习平台 视频管理服务 前端接入 摄像头监控设备 视频流 视频平台 图片流 趋势分析 内容自动屏蔽
5. VisionMind 智能交通系统 应用场景 系统简介 VisionMind视界心·交通系统基于云计算、大数据、深 度学习平台搭建,适用于城市道路交通场景,具备极高 监测准确度,可对30余类机动车、非机动车以及行人 违章行为进行自动识别、抓拍和报警推送,由此获取全 程证据链,形成完整监管闭环。借助闪马智能城市交通 系统,交警部门可以及时准确地进行非现场执法,省去 路口违章识别 路段违章识别 推荐算法 推荐算法 现场取证时间,使城市道路交通管理工作更加高效,减 少道路拥堵问题,降低交通事故发生率,安全出行、放 心出行。 • • • 机动车不礼让行人 机动车大弯小转 非机动车闯红灯 • • • 机动车网状线停车 机动车违法禁止标线 非机动车逆向行驶
6. VisionMind 智能交通系统 上海市某区交警支队 应用场景 城市道路交通路口路段 需求难点 日益增长的外卖、快递需求量以及相关行业的发展,导致非机动车违法,包括闯红灯、 逆行、占用机动车道、人行道行驶等尤为突出。 解决方案 利用现有的治安监控、卡口、交警监控、电子警察监控资源,布控智能违法识别系统, 自动发现并上报外卖等非机动车辆违章事件,统计违章数量,并且为外卖、快递骑手自 动建档。采用后端接流分析,并将识别的结果按照定义的标准和接口进行上报。 治理效果 协助当地交警,成功识别并处置平均每路摄像头:1000起/月,非机动车违法事件,并 为外卖、快递骑手自动归档。 社会价值 推动城市交通的规范化、秩序化、智慧化,对于提升城市形象和地位,发掘潜在经济和 社会效益,将产生难以估量的正面影响和积极意义。
7. VisionMind 客流管理系统 应用场景 系统简介 交通枢纽 开放区域 VisionMind视界心·客流管理系统,用于公共场所、大 型活动区域等地大规模人流疏导管理,同时可分析识别 拉横幅、打架斗殴、人群聚集等异常事件。系统基于深 度学习平台搭建,可承载高峰期十万级人流量。模型由 大量历史数据训练,可根据人流密度变化进行趋势判 • • 打架斗殴 违规拉横幅 • • 翻越围栏 人群突然散开 • • 客流划线计数 人群聚集 • • 区域客流密度 违规拉横幅 断,达到突发事件事前预警,及时防范。现场信息即时 自动上报,指挥室当即掌握前线情况。警务人员可合理 大型活动 调配人员,及时应对突发状况,满足安保指挥需求,减 重点路段 (校门、医院等) 少公共安全事件风险。 • • 打架斗殴 拉横幅识别 • • 翻越围栏 人群突然散开 • • 客流划线计数 人群聚集 • • 区域客流密度 人群突然散开
8. VisionMind 客流管理系统 上海市某区指挥中心 应用场景 市中心重要广场、景区 需求难点 1、客流量超大,区域瞬时大客流可达数万 2、市中心重要场所,对人群异常事件需要及时并准确的告警,且不能因不利环境出现管控盲点 3、城市警力并未达到各区域充分覆盖的程度,因此需要系统及时预判趋势提前预警,便于合理机动 的调配警力; 解决方案 VisionMind 客流系统基于现有监控摄像头,对覆盖区域进行客流统计、客流态势分析以及人群异常 事件(比如异常聚集、打架斗殴、闯入禁区等)识别分析,实现应对各级各类客流流量与人群事件 的准确预警、极速告警、有序疏散,建立管理与疏导长效机制。系统可支持超大规模人群分析,且 对雨天和夜晚等场景有较强的抗干扰能力。 治理效果 由于不涉及施工和设备安装,系统在一周内便完成了部署和上线试运行。正式上线几个月来,已有 效预警数万次,帮助避免或及时处置了多起重大事件,真正帮助警方以现有警力覆盖全辖区。
9. VisionMind 城市治理系统 应用场景 系统简介 VisionMind视界心·城市治理系统,从监控摄取特种车 辆沿途行驶视频,通过平台视觉识别车辆外观、牌照等 信息,分析是否存在车辆未合规覆盖、未按指定路线行 驶等问题,即时抓拍,保留证据。根据违法数量趋势, 找出风险高发地段,便于监管人力事先调配,打通自预 特种车辆身份认证 特种车辆违章识别 推荐算法 推荐算法 特种车辆流量行为统计 警到处罚整体监管闭环,有效解决城市扬尘监管问题, 提升城市管理水平,维护城市环境清洁。 • • 特种车辆识别 车牌识别 • • • 渣土车未覆盖识别 路线违规识别 车辆未注册识别 推荐算法 • • • • 特种车辆行经路段统计 路段流量统计 路段违章统计 非本市车辆出入统计
10. VisionMind 城市治理系统 上海某区城市运营部门 应用场景 城市扬尘治理 需求难点 1. 2. 3. 4. 每天有大量的渣土车来回于不同的道路上,线下力量无法做到提前部署排查; 当前还没有设备、产品能做到渣土车车辆未覆盖的识别; 当前还没有交通道路监控设备、产品能监控渣土车的行为; 对未注册的渣土车同样没有有效的发现手段。 解决方案 通过机器视觉利用交管摄像头对路面行驶的渣土车进行识别,并对“未注册、未合规覆盖、未按规 定路线行驶”等违法行驶实现智能警告,形成对渣土车运营的监管闭环,大幅提升治理效率与效 果。 应用效果 单路段违规从第一周的日均2.65辆次减少到了第四周的0.97辆次。
11. VisionMind 岗位管理系统 应用场景 系统简介 VisionMind视界心·岗位管理系统,应用于服务窗口、 工业岗位监督管理,通过监控视频有效识别岗位人员是 否有脱岗、睡岗、抽烟、玩手机、操作不规范等违规行 为。24小时自动监测预警,节省了80%以上人力审核 时间。模型平均准确率达91%,客观标准减少人工主观 判断风险,视频图片自动化取证避免事后纠纷。维护单 服务窗口形象 位形象,肃正工作风气,减少违规操作,保障生产安 工作流程规范 亮点功能 全。 • • • 工作时间离岗 工作时间睡岗 违反着装规定 亮点功能 • • • 危险操作行为 违反操作标准 违反工作纪律
12. VisionMind 岗位管理系统 某企业客户 应用场景 工厂、营业厅 需求难点 1、某些场景与逻辑判定需要多摄像头联动 2、场景摄像设备多变(镜头与墙壁夹角近垂直角度、鱼眼摄像头画面变形) 3、高要求的异常行为识别(抽烟、玩手机、睡觉、打架等) 解决方案 以实时和历史监控视频流为分析对象,通过对“特殊物品”、“特殊行为”和“工作服”进行智能 识别。结合场景与业务,通过逻辑推理,自动发现岗位管理所需要关注的各类异常事件、触发告 警,并在系统内给出证据源。1个工作日内,服务部署上线,结合机器预警人工复检的结果反馈,不 断进行迭代升级,提高预警的准确率。 应用效果 一季度产生5千多条预警,平均正确率88%。其中服务窗口单模型准确率达91%,帮助发现未穿工 作服、离岗、抽烟、玩手机等问题;值班室占21%,单模型准确率达到82%,帮助发现无人值班等 问题。节省了80%以上审核时间,帮助用户提高人效,规范岗位行为。
13. VisionMind 内容安全系统 应用场景 系统简介 VisionMind 视界心· 内容安全系统,是面向互联网内 容安全需求的一站式多维度 AI 内容审核产品。应对日 均数十亿的视频、图片数据,平台提供了准确率高达 96.4% 色情识别、13 类暴恐类型识别及 2500 余名政 治敏感人物识别功能,结合 Atom 深度学习平台更可 第一时间迭代模型,满足最新审核需求。闪马智能互联 网络监管部门 互联网内容平台 推荐算法 推荐算法 网内容安全系统可为用户提供安全省心的人机双重审核 服务,节省 98% 人力审核成本,守护网络内容环境干 净、有序。 • • • 暴恐粗分类 色情低俗粗分类 视频人物识别 • • • ASMR识别 字幕识别 审核黑白名单
14. VisionMind 内容安全系统 审核总量 监控平台数 1738 视频平台 56% 违规内容 图片 44,162,117 张 图片 24,967 张 视频 21,273,812 个 视频 10,835 个 直播 11,081,783 分钟 直播 265 路 风险预警 七牛云 应用场景 B2B线上内容审核 社交媒体 23% 22500 18000 13500 0.57% 9000 4500 违规 0 7/20 需求难点 风险预警 安全 风险 7/23 7/26 高危 1. 2. 3. 每天产生约几十亿的图像、视频数据,很难通过纯人力抽样来审核 审核人员素质参差不齐,通过培训人审团队并不能很好的把握住统一的标注 2B业务用户标准不同,通过人力审核很难达到特定客户的效果 解决方案 闪马智能团队经过多年打磨,打造出一款集鉴黄、鉴暴恐、鉴政治敏感人物、鉴小广告于一体的高 性能深度过滤产品,通过该产品七牛云协助众多互联网企业完成了在线内容的审核,帮助他们避免 了产品违规的风险,同时相比较纯人工审核团队更降低了人力成本,提高了服务效率。 应用效果 本产品在七牛云已稳定运行一年多,每天处理逾数十亿条图像、视频文件,性能稳定,效果卓著。
15. VisionMind 数据中台 支撑 业务 运营业务 (SaaS) 应用集成 (PaaS) AI模型 数据反馈 闪马运营 平台管理 设备运维 模型 类型 业务分析 平台分析 视频分析 运营分析 运维分析 视频 运营指标 运行日志 数据 类型 数据 架构 业务运营数据 (SaaS+PaaS) 云 边 端
16. 一个平台解决各行业问题:统一算法工程平台 行业应用 算法引擎 ● 统一的算法工程平台,可承载运行多种算法引擎 ● 便于算法部署/升级/管理 城市治理 城市交通 机动车 违法 非机动 车违法 特种 车辆 车流 计数 岗位管理 违规 行为 检测 算法工程 视频接入与管理 城市大客流管理 违规 着装 客流 统计 人群 聚集 分类 算法任务管理 消息 管理 统计 分析 互联网内容安全 打架 斗殴 违规 内容 跟踪 存储 管理 配置 分发 系统 监控 授权 管理 日志 管理 安全 管理
17. 庞大的核心工业级模型库:视频分析模型 以视频异常分析为核心,积累百余个算法模型 结构化 流量参数 基于图片的算法 异常事件 基于流的算法
18. 高效的模型工厂:Atom 深度学习平台 数据 LEGO Big data Model Deployment Serving System Label Video Image Text 每日亿次图像/视频分析推理的数据积累在海量数据上进 行细致数据分布研究和数据标签化,极大加快算法进化速 度。 Cross-platform Service / Model Compilation Universal Compute Schedule Scheduler Cloud adapt Atom Engine Universal Data Access Dataset Manager Training Warmup Data Clean 训练平台 依托丰富云计算服务经验和基础研发能力建立了一套支持 迁移学习、批量调参、自主学习架构的大规模分布式训练 平台。 Virtualization/Orchestration 推理引擎 Hardware /Network 研发了一套完全自主产权、统一架构、依赖极少的推理引 擎,推理速度比原生开源框架快20%以上。
19. 核心算法能力 Re-ID 优势 多模态跨镜头追踪算法架构图 视频流接入 人体检测 解码 人脸记录入库 • • • • 稳定性好:在三大公开数据集上均处于领先水平 速度快:单模型计算,速度达到超实时 可扩展性好:能用于大规模跨镜头追踪 避免浪费:能在不购买新的摄像头/硬件基础之上, 实现跨视频流的行为分析 ID关联 人脸检测 Top1@Market1501 Top1@DUKE Top1@PRW 人物记录入库 Supremind 95.2% 88.8% 67.43% State-of-Art 95.7% 88.7% 52.54%
20. 核心算法能力 人流统计 论文 Crowd Counting with Attention: Dual Path Feature Pyramid Approach 专利 《一种基于生成对抗 神经 网络的人群计数方法以及系统》
21. 核心算法能力 目标检测技术 奖项 • • ImageNet Object Detection 前三 Google OpenImages top 2% 优势 • • • 物体标签丰富 色情识别在真实数据友商比拼中排名第一 暴恐识别在公安部比武测试中排名第一 专利 • 一种基于生成对抗神经网络的图像处理方法 (申请中)
22. 核心算法能力 视频分类 奖项 • • • ACMMM LSVC 2017 亚军 ActivityNet 2018 MIT 季军 ActivityNet 2018 Kinetics 季军 论文 • ACMMM 2017 《Large-Scale Video Classification with Elastic Streaming Sequential Data Processing System》 High Order Neural Networks for Video Classification AutoHighlight : Automatic Highlights Detection and Segmentation in Soccer Matches,IEEE BigData 2018 organization team (发表中) • • 专利 • • 视频分类方法、装置、存储介质及电子设备 视频分类模型训练方法、装置、存储介质及电子设备
23. 高效的应用分发1:VisionMind AI 行业应用平台 统一的工程化平台 VisionMind实现了对视频 流和图片流的统一接入/解 析/管理; 实现了对算法的统一管理/ 调度/推理; 实现了对识别结果的统一 存储/消息转发/统计处 理; 无论何种算法,都可在此 统一平台上运行推理及扩 展迭代。 面向行业应用的平台 VisionMind是面向行业应 用的一体化平台,包含了 “实时AI渲染推流”“预 警墙”“预警统计”“地 图撒点”等基本应用框架 与模块; 实现了从算法到应用的一 站式落地方案 便于集成的平台 VisionMind可以成为独 立的一个产品;或者成为 一个模块,嵌入用户整体 集成方案中,成为方案中 智能化体验的一大亮点; VisionMind也提供标准 化API接口,提供预警结 果集成至用户应用中。 快速部署的一体机平台 可实现数据运营的平台 VisionMind在linux操作系 统上采用容器技术,可在1 个小时内完成部署 VisionMind具备审核平 台,在集成项目交付之 外,还可以采用数据运营 模式,提供数据服务交付 VisionMind通常采用一体 机的交付模式,便于快速 部署、交付和扩容 VisionMind与闪马智能 Atom深度学习平台无缝衔 接,实现模型快速迭代
24. 高效的应用分发2: VisionMind —— 面向行业应用 l 面向行业应用的统一框架,包含了“实时AI渲染推流”“预警墙”“预警统计”“地图撒点”等 基本应用框架与模块; l 实现了从算法到应用的一站式落地方案
25. 高效的数据运营:VisionMind —— 数据运营 ● VisionMind 具备审核平台,在集成项目交付之外,还可以采用数据运营模式,提供数据服务交付 ● VisionMind 与 ATOM深度学习平台无缝衔接,实现模型快速迭代,形成数据闭环 视频源 行业应用 视频分析 多端推理引擎(中心、边缘、端) 违规 视频 交通 违章 突发 事件 输出分析结果 智慧城市 异常 行为 互联网视频内容 工业与岗位 Atom 深度学习平台 互联网内容安全 城市摄像头数据 数据运营体系 模型迭代 算法优化 调整参数 更多行业
26. AI 工业化 实现视觉智能应用快速落地 产业规模化 认知与拓展 知识库 海量数据 • 6000亿个图像视频文件 • 每天新增数十亿文件 互联网数据 城市大数据 视频结构化 大数据检索 知识图谱 • 依托自研 Atom 深度学 习平台构建高质量模型 • 以迁移学习的方法论将 已有的模型能力延伸到 其他场景 • 高效构建视频大数据应 用,落地效率相较硬件 产品提升 3 倍以上 • 拥有完整的数据运营体 系,收集实际使用反馈 数据持续升级产品 爬虫 富媒体大数据平台 深度学习平台 完善的运营支撑体系 高效一体化的科研和工程团队 视频应用服务平台
27. Thanks

Home - Wiki
Copyright © 2011-2024 iteam. Current version is 2.139.0. UTC+08:00, 2024-12-23 23:52
浙ICP备14020137号-1 $Map of visitor$