类库 - 在线工具

google/speaker-id

该仓库提供音频样本和相关材料，支持Google的语音与语言团队的研究成果，旨在为声纹识别等应用提供支持。

Python

426

39

Apache License 2.0

5天前

multimodal-art-projection/YuE

YuE是一个开源的音乐生成基础模型，能够将歌词转化为完整歌曲，支持多种风格和语言。

Python

5,414

620

Apache License 2.0

5天前

Mindinventory/MindSQL

MindSQL是一个Python库，通过自然语言查询简化数据库交互，支持PostgreSQL、MySQL、SQLite等多种数据库，结合GPT-4和Llama 2提供智能化响应。

Python

415

42

GNU General Public License v3.0

6天前

jolovicdev/shandu

Shandu是一个先进的AI研究助手，利用多种搜索引擎和语言模型，自动进行深入研究并生成结构良好的报告，适用于学术研究、市场分析等。

Python

627

70

MIT License

5天前

VAST-AI-Research/TripoSR

TripoSR是一个开源模型，能从单张图片快速重建高质量3D对象，性能优于其他开源替代品，适用于各类3D应用。

Python

5,652

669

MIT License

5天前

allenai/dolma

Dolma是一个用于生成和检查OLMo预训练数据的工具和数据集，包含丰富的文本数据，适合语言模型训练。

Python

1,301

147

Apache License 2.0

1周前

allenai/olmocr

olmocr是一个工具包，用于将PDF和其他基于图像的文档格式转换为干净、可读的纯文本格式，支持复杂排版与数学公式。

Python

13,893

1,028

Apache License 2.0

5天前

GitHamza0206/simba

Simba是一个开源的便携式知识管理系统，旨在与任何检索增强生成(RAG)系统无缝集成，帮助用户高效管理知识。

Python

1,348

92

Apache License 2.0

5天前

chrischoy/WhisperChain

WhisperChain是一个实现语音转文本的工具，利用AI清理填充词并优化文字记录，提升工作效率。

Python

319

18

BSD 3-Clause "New" or "Revised" License

1周前

getzep/zep

Zep是一个针对AI代理的记忆平台，通过用户互动和业务数据学习，构建时间知识图谱，为AI助手提供个性化的信息，提升用户体验。

Python

3,565

536

Apache License 2.0

5天前

类库

文库