话题框架与类库 › trocr

框架与类库:trocr

Fine Tuning TrOCR on Curved Text Dataset

TrOCR模型在曲线文本识别上表现不佳,通过对SCUT-CTW1500数据集进行微调,显著提升了其性能。使用Hugging Face Trainer API,模型经过35个epoch训练后,字符错误率(CER)降至49%。实验表明,微调后的TrOCR不仅能准确识别曲线文本,还能处理模糊和垂直文本,展示了其在复杂场景下的强大适应能力。

使用OCR识别手写文本

本文介绍了基于微调TrOCR模型的手写文本识别方法。使用GNHK手写笔记数据集,通过预处理将文档图像裁剪为单词图像,并生成对应的CSV文件。随后,对TrOCR模型进行微调,训练后使用验证集进行推理,结果显示模型表现优异,成功识别了大部分手写单词。整个过程包括数据预处理、模型训练和推理,展示了TrOCR在手写文本识别中的强大能力。

Transformer技术在好大夫在线的落地探索

众所周知,好大夫在线拥有数十亿条医患交流和数亿张医疗相关照片。它们占有着大量的存储空间,且由于标记成本过高,而没办法被利用。Transformer技术给了我们一个将它们利用起来的机会,从而给医患群体提供更可靠的帮助。

来也智能文档处理系统中的印章识别实践

智能文档处理(IDP)可帮助企业实现日常文档处理工作的自动化,在文档识别、分类、信息抽取和比对等各个方面,为企业工作人员提供帮助。印章识别是智能文档处理中一种重要的识别能力,广泛应用在合同比对,出入库审核以及发票报销等场景。以往这些工作环节中需要人工对印章图像进行核对校验,流程繁冗,而使用OCR技术进行印章自动识别则可为企业有效节省用工成本。

  • «
  • 1
  • »

首页 - Wiki
Copyright © 2011-2025 iteam. Current version is 2.142.1. UTC+08:00, 2025-03-15 06:19
浙ICP备14020137号-1 $访客地图$