How We Built a Custom Vision LLM to Improve Document Processing at Grab

オンラインツール

オンラインツール

ランキングリスト

反馈

オンラインツール

ホーム話題

ライブラリコードベースお店

詳細表示

How We Built a Custom Vision LLM to Improve Document Processing at Grab

出处：engineering.grab.com

存档：存档

译文：中文

摘要

东南亚语言和文档格式多样，传统OCR系统在处理时面临挑战。为解决这一问题，我们开发了轻量级专用视觉LLM。通过合成OCR数据集和内部平台Documint生成高质量训练数据，采用两阶段训练方法，显著提升了OCR和关键信息提取的准确性。最终，我们构建了1B参数的定制模型，在保持高性能的同时降低了延迟，验证了小型专用模型的有效性。

阅读原文

蚂眯仔于 2025-11-04 分享

3319

关联话题： #Grab

欢迎在评论区写下你对这篇文章的看法。