DocLayout-YOLO是一个基于YOLO-v10的实时文档布局检测模型,通过多样化合成数据和全局-局部自适应感知,提升文档布局分析能力。
Python
1,554
121
GNU Affero General Public License v3.0
2个月前
GOT-OCR2.0是一个通用OCR理论的官方代码实现,提供了一种统一的端到端模型,旨在提升文本识别的效果与效率。
Python
7,807
687
2个月前
DreamClear是一个高容量的真实世界图像修复工具,提供隐私安全的数据集策划,旨在提升图像处理效果,适用于各类研究和项目。
Python
1,167
50
Apache License 2.0
2个月前
EveryoneNobel是一个灵活的框架,利用ComfyUI生成个性化的诺贝尔奖图像,适合各种应用与定制。
Python
1,400
90
Apache License 2.0
2个月前
Fact Finder是一个基于Python的工具,通过结合外部API和图谱查询,帮助用户从自然语言问题中提取信息并提供答案。
Python
112
12
MIT License
3个月前
F5-TTS是一个利用扩散变换器技术生成流利且忠实语音的工具,适用于文本到语音的转化。
Python
13,004
1,888
MIT License
2个月前
PMRF是一个图像修复算法,旨在在保证视觉质量的前提下最小化均方误差(MSE),用于生成高质量的图像恢复效果。
Python
696
40
MIT License
2个月前
Prompt Poet 是一个低代码的提示设计工具,简化开发者与非技术用户的交互,帮助快速创建灵活的 AI 提示。
Python
1,103
94
MIT License
2个月前
ell是一个轻量级的编程库,旨在简化语言模型的提示工程,使用户能够高效地管理和优化提示程序。
Python
5,805
349
MIT License
2个月前
这个仓库是一个示例项目,展示了如何使用GraphRAG处理文档,提取实体和关系,并在图数据库中管理它们,结合了OpenAI的自然语言处理和Neo4j的数据库管理。
Python
13
5
MIT License
2个月前

Home - Wiki
Copyright © 2011-2025 iteam. Current version is 2.147.1. UTC+08:00, 2025-11-07 06:03
浙ICP备14020137号-1 $Map of visitor$