话题AI模型架构 › yolo

AI模型架构:yolo

关联话题: yolo11、yolov5、yolov8、yolo26

YOLO11答题卡题型区域识别

这篇教程手把手教你用YOLO11模型搞定答题卡题型识别!从数据标注到模型训练再到部署落地,全程干货满满。先用label-studio制作数据集,再通过Python脚本自动分割训练集和验证集。接着详细讲解YOLO11训练参数调优技巧,最后教你将模型转为ONNX格式并用Python实现高效推理。文末还附上可视化代码,让检测结果一目了然。跟着做,你也能轻松实现专业级的答题卡识别系统!

基于 yolo_v5 实现游戏辅助瞄准

用YOLOv5训练王者荣耀英雄识别模型,结合坐标转换脚本实现自动瞄准!从环境配置到模型训练,详细拆解2.5D视角下的坐标转换难点,最终测试命中率超预期。虽然真人对战还有延迟问题,但量化模型和优化脚本后潜力巨大。

从手工到智能:YOLOv8 实现烤肉摊签子自动统计

YOLOv8 助力西安烤肉摊自动数签子!只需拍照,AI 模型便能快速识别并标注签子,精准统计数量。从环境配置到模型训练,再到批量预测,整个过程高效便捷。GPU 加速训练,ONNX 跨平台部署,让 AI 技术轻松融入日常生活,省时省力,让烤肉摊老板告别手动数签子的烦恼。

Open-Source Handwritten Signature Detection Model

本文介绍了一个开源项目,专注于文档处理中的自动签名检测。项目通过数据集工程、架构基准测试、模型优化和生产部署四个关键阶段,系统评估了YOLO、DETR等先进目标检测架构,并利用Optuna进行超参数调优,最终在CPU和GPU上实现了高效的推理性能。实验结果表明,该项目在精度、召回率和推理速度之间取得了良好平衡,适用于实际应用场景。

结合YOLOv8和OpenCV WeChat QRCode打造一款二维码识别器

二维码(QR Code)在现代生活中有广泛应用,从支付系统到信息传递,它们无处不在。本文提出了一种如何识别二维码的方法,主要贡献在于优化处理分辨率较高的图像时,由于二维码在整张图片中占据的比例较小, 传统的OpenCV WeChat QRCode的识别方法表现不佳的问题。

一张城管事件图片背后的算法原理

在基于深度神经网络的诸多算法中,目标检测算法是计算机视觉和数字图像处理领域的一个重要方向,其广泛应用于智能视频监控、自动驾驶、工业检测等领域,这些应用领域都将目标检测算法作为基础算法,通过该算法自动识别图像内容,将识别的内容信息作为后续算法的前提。

在政通的城管视频智能分析项目中,也是采用目标检测算法对城管图片实现自动识别并上报功能,减少人力成本的消耗,同时依托公司独有的城管数据集和项目落地经验,不断提升事件的识别精度。

来也智能文档处理系统中的印章识别实践

智能文档处理(IDP)可帮助企业实现日常文档处理工作的自动化,在文档识别、分类、信息抽取和比对等各个方面,为企业工作人员提供帮助。印章识别是智能文档处理中一种重要的识别能力,广泛应用在合同比对,出入库审核以及发票报销等场景。以往这些工作环节中需要人工对印章图像进行核对校验,流程繁冗,而使用OCR技术进行印章自动识别则可为企业有效节省用工成本。

智能切图平台 - 基于yolov5神经网络的目标检测实践总结

在线切图平台项目是前端通道的提效项目,希望能通过对设计稿的分析,将设计稿转成HTML,我们尝试使用深度学习来自动识别图片中的文字和图片,这篇文章记录实现过程和总结。

一种基于目标检测实现黑花屏分类任务的方案

视频帧的黑、花屏的检测是视频质量检测中比较重要的一部分,传统做法是由测试人员通过肉眼来判断视频中是否有黑、花屏的现象,这种方式不仅耗费人力且效率较低。为了进一步节省人力、提高效率,一种自动的检测方法是大家所期待的。目前,通过分类网络模型对视频帧进行分类来自动检测是否有黑、花屏是比较可行且高效的。然而,在项目过程中,视频帧数据的收集比较困难,数据量较少,部分花屏和正常屏之间差异不够明显,导致常用的分类算法难以满足项目对分类准确度的要求。因此本文尝试了一种利用目标检测算法实现分类的方式,帮助改善单纯的分类的算法效果不够理想的问题。

基于YOLO的王者荣耀精彩时刻自动剪辑

企鹅电竞是一款游戏直播产品,其中游戏短视频社区是其重要组成部分。

为了丰富游戏短视频内容,针对王者荣耀,需要一套自动化剪辑精彩时刻的系统,以能够快速根据主播直播内容生成精彩时刻反馈到游戏短视频社区。

AI落地场景探索:医学报告单结构化

在好大夫在线每天的线上问诊中,包含了大量的各种医院报告单、化验单等图片,如何识别并格式化这些报告单数据,成了我们面临的一大难题。

  • «
  • 1
  • »

inicio - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.0. UTC+08:00, 2026-03-23 06:38
浙ICP备14020137号-1 $mapa de visitantes$