LLM-Aided OCR项目通过应用大语言模型技术,提升扫描PDF的光学字符识别(OCR)输出质量,生成准确易读的文档。
Python
2,737
188
2周前
qqwry是一个自动更新的纯真IP数据库,提供最新的IP地址信息,便于开发者进行IP相关查询和应用。
Python
668
128
GNU General Public License v3.0
1周前
Devon 是一个开源的配对编程工具,旨在帮助开发者提高协作效率,支持多种编程任务。
Python
3,448
283
GNU Affero General Public License v3.0
2周前
LLM4Decompile是一个利用大语言模型反编译二进制代码的工具,主要用于逆向工程和代码分析。
Python
5,896
405
MIT License
1周前
Fish Speech是一个开源的多语言文本转语音(TTS)工具,支持语音克隆,提供最新的技术水平,方便开发者集成和使用。
Python
22,767
1,876
Apache License 2.0
1周前
ComfyUI-segment-anything-2是一个使用segment-anything-2的ComfyUI节点,功能正在开发中,提供模型下载及节点测试,助力用户进行图像分割。
Python
1,022
65
Apache License 2.0
2周前
AudioNotes是一个音视频转结构化Markdown笔记的系统,利用大模型快速提取和整理内容,便于阅读与记忆。
Python
1,846
264
MIT License
1周前
FLUX是一个开源模型推理库,支持图像生成和编辑,提供简单的本地安装和TensorRT支持。
Python
24,089
1,760
Apache License 2.0
1周前
MinerU是一款高质量的开源工具,将PDF文件转换为Markdown和JSON格式,便于数据提取和处理。
Python
42,396
3,479
GNU Affero General Public License v3.0
1周前
CatVTON是一个高效的虚拟试穿扩散模型,具备轻量网络和简化推断,适用于图像合成与虚拟试衣应用。
Python
1,483
178
Other
2周前

- 위키
Copyright © 2011-2025 iteam. Current version is 2.146.0. UTC+08:00, 2025-09-06 15:02
浙ICP备14020137号-1 $방문자$