这是一个将YouTube视频转换为结构化文档的工具,可提取视频元数据、字幕和评论,生成适合AI工具和大型语言模型理解的格式,便于知识库索引和分析。
Python
274
22
1天前
TreePilot是一个基于GitHub Copilot SDK构建的AI驱动家谱研究代理工具。它支持导入GEDCOM格式的家谱文件,提供交互式祖先树可视化,并利用AI从维基百科、Wikidata、历史报纸和Google Books等多源数据中自动研究家族历史。适用于家谱爱好者和研究者。
Python
32
3
2天前
DS2API 是一个将 DeepSeek 免费对话服务转换为 OpenAI 和 Claude 兼容 API 的工具,支持多账号轮询、自动 Token 刷新和后台管理界面,可通过 Vercel 一键部署或本地运行,便于快速集成。
Python
107
28
GNU General Public License v3.0
1天前
Dateparser是一个Python库,用于解析人类可读的日期和时间字符串,支持绝对日期、相对日期和时间戳等多种格式,帮助开发者轻松处理自然语言中的日期信息。
Python
2,778
488
BSD 3-Clause "New" or "Revised" License
3天前
Upsonic是一个开源的、面向金融科技和银行业的AI智能体开发框架。它旨在让构建生产就绪、安全且可扩展的AI代理变得简单,特别注重安全引擎和OCR能力。可用于文档分析、客户服务自动化、金融分析和合规监控等场景。
Python
7,770
718
MIT License
2天前
OmniAudio是一个开源项目,用于从360度全景视频生成沉浸式空间音频。它基于PyTorch实现,提供预训练模型和数据集,旨在通过AI技术将视觉内容转换为对应的三维声音体验。
Python
356
12
3天前
Papermerge是一个开源文档管理系统,专注于扫描文档的数字化管理。它通过OCR提取文本、建立索引并支持全文搜索,提供类似现代桌面文件浏览器的Web界面,支持多用户、标签、文件夹分类和文档版本管理。
Python
434
94
Apache License 2.0
2天前
这是一个通过频率分解实现身份保持的文本到视频生成框架,能够在生成动态视频时准确保留人物身份特征。该项目为CVPR 2025亮点论文,提供代码、演示和预训练数据。
Python
809
44
Apache License 2.0
2天前
PKU-YuanGroup/ConsisID cover
Chunklet-py 是一个 Python 库,用于智能分割文本、代码和文档,专为大型语言模型(LLMs)和检索增强生成(RAG)管道设计。它提供更精细的分块策略,避免简单字符分割,提升数据处理质量。
Python
60
2
MIT License
3天前
Soprano-Factory是一个精简的训练脚本(约600行代码),允许用户使用自己的数据和硬件,训练或微调Soprano超快速文本转语音模型。用户可借此为原模型添加新声音、风格和语言支持。
Python
202
31
Apache License 2.0
1天前
OmniDictate 是一个免费、开源的实时语音转文字工具,专为 Windows 设计。它利用本地 AI 模型进行离线转录,通过图形界面将文本直接输入到任何活动应用程序中,注重隐私和易用性。
Python
79
9
Other
3天前
gurjar1/OmniDictate cover
这是一个使用现代数据栈技术构建的物联网平台概念验证项目,集成了Prefect(工作流编排)、DuckDB(数据库)、FastAPI(API服务)和Streamlit(Web界面),用于从零开始实现物联网数据采集、处理和可视化演示。
Python
26
2
3天前
这是一个利用AI深度映射技术,将2D视频转换为3D内容的工具套件。它支持多种输出格式,专为VR/AR内容创作和影视制作设计,提供一站式3D生成解决方案。
Python
159
15
Other
2天前
VisionDepth/VisionDepth3D cover
SketchVideo是基于草图的视频生成与编辑工具,通过手绘草图实现空间和动态的细粒度控制,支持从单帧或多帧草图生成视频,以及对真实或合成视频进行编辑。
Python
95
8
Apache License 2.0
3天前
IGLICT/SketchVideo cover
ViPE是NVIDIA开发的视频姿态引擎,用于从原始视频中自动标注相机姿态和密集深度图,支持各种相机模型和场景,适用于3D感知和空间AI系统的开发。
Python
1,693
132
Other
1天前
nv-tlabs/vipe cover

- 위키
Copyright © 2011-2026 iteam. Current version is 2.152.0. UTC+08:00, 2026-02-06 00:43
浙ICP备14020137号-1 $방문자$