Upsonic是一个开源的、面向金融科技和银行业的AI智能体开发框架。它旨在让构建生产就绪、安全且可扩展的AI代理变得简单,特别注重安全引擎和OCR能力。可用于文档分析、客户服务自动化、金融分析和合规监控等场景。
OmniAudio是一个开源项目,用于从360度全景视频生成沉浸式空间音频。它基于PyTorch实现,提供预训练模型和数据集,旨在通过AI技术将视觉内容转换为对应的三维声音体验。
Papermerge是一个开源文档管理系统,专注于扫描文档的数字化管理。它通过OCR提取文本、建立索引并支持全文搜索,提供类似现代桌面文件浏览器的Web界面,支持多用户、标签、文件夹分类和文档版本管理。
这是一个通过频率分解实现身份保持的文本到视频生成框架,能够在生成动态视频时准确保留人物身份特征。该项目为CVPR 2025亮点论文,提供代码、演示和预训练数据。
Chunklet-py 是一个 Python 库,用于智能分割文本、代码和文档,专为大型语言模型(LLMs)和检索增强生成(RAG)管道设计。它提供更精细的分块策略,避免简单字符分割,提升数据处理质量。
Soprano-Factory是一个精简的训练脚本(约600行代码),允许用户使用自己的数据和硬件,训练或微调Soprano超快速文本转语音模型。用户可借此为原模型添加新声音、风格和语言支持。
OmniDictate 是一个免费、开源的实时语音转文字工具,专为 Windows 设计。它利用本地 AI 模型进行离线转录,通过图形界面将文本直接输入到任何活动应用程序中,注重隐私和易用性。
这是一个使用现代数据栈技术构建的物联网平台概念验证项目,集成了Prefect(工作流编排)、DuckDB(数据库)、FastAPI(API服务)和Streamlit(Web界面),用于从零开始实现物联网数据采集、处理和可视化演示。
这是一个利用AI深度映射技术,将2D视频转换为3D内容的工具套件。它支持多种输出格式,专为VR/AR内容创作和影视制作设计,提供一站式3D生成解决方案。
SketchVideo是基于草图的视频生成与编辑工具,通过手绘草图实现空间和动态的细粒度控制,支持从单帧或多帧草图生成视频,以及对真实或合成视频进行编辑。
ViPE是NVIDIA开发的视频姿态引擎,用于从原始视频中自动标注相机姿态和密集深度图,支持各种相机模型和场景,适用于3D感知和空间AI系统的开发。
这是一个通过元提示技术优化和生成提示词的工具,利用高级语言模型为低级模型改进提示结构,以获得更有效、相关的生成结果,支持代码运行和人设自动生成。
Prismer.AI是一个开源的AI智能体平台,旨在替代OpenAI的Prism产品。它提供了一个完整的AI解决方案,包括论文阅读、上下文云服务和详细文档,致力于构建开放、可访问的AI基础设施。
企业级AI营销自动化工具,为Claude Code、Cursor、GitHub Copilot等AI助手提供18个专业营销代理、93个命令和28项技能。涵盖活动策划、内容创作、SEO、转化优化、邮件序列和数据分析等功能,专为SaaS创始人、营销人员和增长团队设计。
DeepDive是一个用于训练深度搜索智能体的框架,通过知识图谱自动合成问答数据,并结合多轮强化学习,使智能体能够执行复杂的多步骤网络搜索和信息寻求任务。


