keras-ocr是一个封装灵活的文本检测和识别模型,结合CRAFT文本检测器和Keras CRNN,提供高层API以简化文本识别管道的训练和使用。
Python
1,461
371
MIT License
1周前
PDF-Extract-Kit是一个强大的开源工具包,旨在高效提取复杂PDF文档中的高质量内容,支持多种文档解析任务。
Python
8,397
618
GNU Affero General Public License v3.0
1周前
StructEqTable-Deploy是一个高效的开源工具包,旨在将表格图像转换为LaTeX/HTML/Markdown,支持科学出版、财务报表等多种场景。
Python
258
23
Apache License 2.0
1周前
UniMERNet是一个通用网络,用于将数学公式图像转换为LaTeX,适用于各种真实场景。
Python
396
33
Apache License 2.0
1周前
此仓库提供了一种基于检测的手写文本识别模型,支持在真实数据上进行训练和优化,适用于文本检测和识别任务。
Python
157
18
Apache License 2.0
2周前
CosyVoice是一个多语言大规模语音生成模型,提供高质量的语音合成、训练和部署功能,支持多种语言和方言,具有低延迟和高准确性。
Python
15,944
1,709
Apache License 2.0
1周前
WhyHow知识图谱工作室是一个易于创建和管理RAG原生知识图谱的平台,支持灵活的数据摄取和模块化图构建,适用于实验与大规模应用。
Python
781
86
MIT License
1周前
VideoLingo是一个全能视频翻译、本地化和配音工具,旨在生成Netflix级别的字幕,支持一键自动化处理,打破语言障碍。
Python
14,852
1,518
Apache License 2.0
1周前
AnchorCrafter是一个基于扩散模型的系统,用于生成以人类与产品互动为基础的高质量推广视频,提升电商和广告效果。
Python
610
44
1周前
这是一个开源的AIOps和告警管理平台,提供告警去重、丰富、过滤和关联功能,支持双向集成和自定义工作流程,旨在提升告警管理效率。
Python
10,611
1,038
Other
1周前

Accueil - Wiki
Copyright © 2011-2025 iteam. Current version is 2.146.0. UTC+08:00, 2025-09-01 02:13
浙ICP备14020137号-1 $Carte des visiteurs$