Dedoc 是一个自动化文档解析库,能够提取文档内容、逻辑结构、表格及元信息,并转换为统一格式,方便文档处理和分析。
AiNiee是一款AI翻译工具,支持自动翻译游戏、书籍、字幕、文档等复杂长文本,操作简单高效。
PDFMathTranslate 是一个基于 AI 的 PDF 文档翻译工具,可以完整保留排版,支持多种翻译服务,适用于科研论文的双语翻译。

该仓库提供了一系列实用示例,展示多种代理设计模式和应用,帮助用户构建和 orchestration 多代理系统。
LangExtract是一个Python库,利用大型语言模型从非结构化文本中提取结构化信息,支持来源精确定位和互动可视化,适合处理临床笔记等文档。
ShieldEye ComplianceScan是一个网络安全扫描工具,提供现代图形用户界面,支持网页漏洞扫描及合规检查,并生成专业的安全报告。
dots.ocr是一个强大的多语言文档解析工具,结合了布局检测与内容识别,适用于各类文档处理。
MathTranslate是一个用于翻译LaTeX文档的工具,特别适合翻译科学论文,如arXiv论文,能够保持数学表达式不变,最后可编译为PDF文件。

Aphra是一个开源翻译助手,通过大型语言模型提升文本翻译质量,采用多阶段的上下文感知过程,旨在实现更准确、细致的翻译。
Open-Parse是一款灵活易用的库,旨在优化复杂文档的切分,适用于RAG系统,支持有效识别文档布局与内容分块。
