GLM-OCR:0.9B 参数如何在文档解析上打败 235B 的 Qwen3-VL

摘要

智谱AI推出的GLM-OCR是一款0.9B参数的文档理解多模态模型,凭借布局感知的两阶段流水线和MTP解码技术,在OmniDocBench v1.5上以94.62分领先。其PDF处理速度达1.86页/秒,远超同类产品。GLM-OCR通过GRPO强化学习优化结构化输出,尤其在印章识别上表现突出,展现了小模型在特定任务上的高效与精准。

欢迎在评论区写下你对这篇文章的看法。

评论

Home - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.0. UTC+08:00, 2026-03-25 02:37
浙ICP备14020137号-1 $Map of visitor$