doc-page-extractor是一个Python工具,可以从图像中识别文本和格式,并返回结构化数据,适用于文档处理和数据提取。
LayoutReader是一个基于LayoutLMv3的高效模型,用于排序OCR框的阅读顺序,优化了文档解析和多语言处理。
PDF Craft用于将PDF文件转换为多种格式,专注于处理扫描书籍的PDF文件,提取文本并生成连贯内容。
NexusAI是一个开源平台,结合人类和AI的能力,实现任务自动化、智能决策和流程可视化,提高团队协作效率。
AIDocks是一个大型语言模型(LLM)训练API,支持对嵌入、重排序及模型优化,旨在优化和发布机器学习模型。
MusicInfuser是一个将文本和音乐结合的生成模型,能够根据音乐和文本提示生成舞蹈视频。
PandaLM 是一个用于大型语言模型的可重复和自动化评估工具,旨在比较不同模型的响应并提供决策依据,适合数据保密和资金有限的组织使用。
StarVector是一个用于SVG生成的基础模型,通过视觉和语言建模架构,将矢量化转换为代码生成任务,能够高效地处理图像和文本,生成高质量的SVG代码。
Second-Me是一个开源原型,允许用户构建自己的AI自我,强调个体性和数据控制,同时在全球网络中扩展智能。
Letta是一个开源框架,用于构建具有高级推理能力和长期记忆功能的状态代理,适用于多种模型场景。