Upsonic是一个开源的、面向金融科技和银行业的AI智能体开发框架。它旨在让构建生产就绪、安全且可扩展的AI代理变得简单,特别注重安全引擎和OCR能力。可用于文档分析、客户服务自动化、金融分析和合规监控等场景。
Python
7,763
716
MIT License
1天前
OmniAudio是一个开源项目,用于从360度全景视频生成沉浸式空间音频。它基于PyTorch实现,提供预训练模型和数据集,旨在通过AI技术将视觉内容转换为对应的三维声音体验。
Python
354
12
1天前
Papermerge是一个开源文档管理系统,专注于扫描文档的数字化管理。它通过OCR提取文本、建立索引并支持全文搜索,提供类似现代桌面文件浏览器的Web界面,支持多用户、标签、文件夹分类和文档版本管理。
Python
431
92
Apache License 2.0
1天前
这是一个通过频率分解实现身份保持的文本到视频生成框架,能够在生成动态视频时准确保留人物身份特征。该项目为CVPR 2025亮点论文,提供代码、演示和预训练数据。
Python
806
44
Apache License 2.0
1天前
Chunklet-py 是一个 Python 库,用于智能分割文本、代码和文档,专为大型语言模型(LLMs)和检索增强生成(RAG)管道设计。它提供更精细的分块策略,避免简单字符分割,提升数据处理质量。
Python
60
2
MIT License
1天前
Soprano-Factory是一个精简的训练脚本(约600行代码),允许用户使用自己的数据和硬件,训练或微调Soprano超快速文本转语音模型。用户可借此为原模型添加新声音、风格和语言支持。
Python
182
31
Apache License 2.0
1天前
OmniDictate 是一个免费、开源的实时语音转文字工具,专为 Windows 设计。它利用本地 AI 模型进行离线转录,通过图形界面将文本直接输入到任何活动应用程序中,注重隐私和易用性。
Python
78
9
Other
1天前
gurjar1/OmniDictate cover
这是一个使用现代数据栈技术构建的物联网平台概念验证项目,集成了Prefect(工作流编排)、DuckDB(数据库)、FastAPI(API服务)和Streamlit(Web界面),用于从零开始实现物联网数据采集、处理和可视化演示。
Python
26
2
1天前
这是一个利用AI深度映射技术,将2D视频转换为3D内容的工具套件。它支持多种输出格式,专为VR/AR内容创作和影视制作设计,提供一站式3D生成解决方案。
Python
133
15
Other
1天前
SketchVideo是基于草图的视频生成与编辑工具,通过手绘草图实现空间和动态的细粒度控制,支持从单帧或多帧草图生成视频,以及对真实或合成视频进行编辑。
Python
92
8
Apache License 2.0
1天前
IGLICT/SketchVideo cover
ViPE是NVIDIA开发的视频姿态引擎,用于从原始视频中自动标注相机姿态和密集深度图,支持各种相机模型和场景,适用于3D感知和空间AI系统的开发。
Python
1,680
132
Other
1天前
这是一个通过元提示技术优化和生成提示词的工具,利用高级语言模型为低级模型改进提示结构,以获得更有效、相关的生成结果,支持代码运行和人设自动生成。
Python
44
1
Apache License 2.0
1天前
Prismer.AI是一个开源的AI智能体平台,旨在替代OpenAI的Prism产品。它提供了一个完整的AI解决方案,包括论文阅读、上下文云服务和详细文档,致力于构建开放、可访问的AI基础设施。
Python
521
16
Other
1天前
企业级AI营销自动化工具,为Claude Code、Cursor、GitHub Copilot等AI助手提供18个专业营销代理、93个命令和28项技能。涵盖活动策划、内容创作、SEO、转化优化、邮件序列和数据分析等功能,专为SaaS创始人、营销人员和增长团队设计。
Python
93
6
MIT License
1天前
DeepDive是一个用于训练深度搜索智能体的框架,通过知识图谱自动合成问答数据,并结合多轮强化学习,使智能体能够执行复杂的多步骤网络搜索和信息寻求任务。
Python
259
23
1天前

Accueil - Wiki
Copyright © 2011-2026 iteam. Current version is 2.150.0. UTC+08:00, 2026-02-03 05:24
浙ICP备14020137号-1 $Carte des visiteurs$