类库 - 온라인도구

WingedGuardian/GENesis-AGI

GENesis-AGI是一个具备持久记忆、自学习和自主进化能力的Python AI智能体。它作为认知伙伴，能记住历史并持续学习，旨在突破传统AI交互限制，实现真正的自主代理功能，适用于需要长期记忆和自适应行为的复杂场景。

Python

79

13

MIT License

2周前

JY0284/zizhitongjian

该项目提供《资治通鉴》文白对照文本及结构化数据，支持AI辅助理解与历史研究。核心亮点为基于React和D3.js开发的交互式可视化系统，包含时间轴、人物关系网络及地图功能，便于直观探索历史事件与人物关联。

Python

190

52

GNU General Public License v3.0

2周前

huawei-csl/KVarN

KVarN是vLLM的原生KV缓存量化后端，无需校准且仅需一个标志即可启用。它提供3-5倍上下文容量和高于FP16的吞吐量，同时保持FP16级精度，专为智能体和长上下文工作负载设计，显著提升并发处理能力。

Python

400

24

Apache License 2.0

2周前

meamaturinlove221/TuringResearch_plus

TuringResearch是一个本地优先的AI辅助科研操作系统，旨在将混乱的研究目标转化为结构化的证据账本、方法卡片和实验路线。它帮助研究人员管理从文献综述到报告生成的完整循环，确保结果真实可靠，便于导师审查。

Python

146

5

Other

3周前

pinokiofactory/RMBG-2-Studio

基于BRIA-RMBG-2.0的增强型背景移除应用。支持拖拽画廊、图像合成、色彩分级及批量处理，具备低显存占用特性。通过Pinokio提供图形界面，便于用户快速安装和使用，适用于需要高效图片抠图与后期处理的场景。

Python

275

37

2周前

Andyyyy64/whichllm

whichllm是一个Python CLI工具，用于根据用户硬件（GPU/CPU/RAM）自动推荐并排名HuggingFace上的最佳本地LLM。它通过实时基准测试而非参数量进行排序，支持模拟不同显卡性能、对比升级方案及直接运行模型聊天，帮助用户快速找到最适合当前设备的模型。

Python

4,841

264

MIT License

2周前

ideogram-oss/ideogram4

Ideogram 4是Ideogram开源的文本生成图像模型，支持2K分辨率、多语言文字渲染及结构化JSON提示。提供API接口与HuggingFace模型权重，适用于图像设计、排版及创意生成场景。

Python

2,076

205

Apache License 2.0

2周前

Pillarpaheat/good-question-171

Good Question 是一个基于 Python 的 Agent Skill，旨在帮助研究者打磨科研问题。它能将模糊兴趣或文献缺口转化为结构化的研究卡片，评估问题的重要性、可行性与可证伪性，并提供领域特定的优化建议，辅助用户判断研究方向的价值。

Python

7

0

MIT License

4周前

sparklecatta-lang/sprite-video-lab

Sprite Video Lab 是本地网页工具，用于将视频或序列帧整理为2D Sprite资源。支持抠图（绿幕、AI、亮度）、抽帧、去背景及导出Sprite Sheet。基于Python和FFmpeg，适合Windows本地工作流。

Python

81

9

MIT License

2周前

opendatalab/MinerU-Popo

MinerU-Popo是一个轻量级通用OCR后处理框架，旨在将页面级OCR解析转化为文档级语义结构。它通过4B模型执行表格/文本截断、标题层级及图文关联分析，解决跨页几何不连续和长文档处理难题，显著提升文档树结构构建的准确性与一致性。

Python

184

10

MIT License

2周前

MisoLabsAI/MisoTTS

Miso TTS 是一个拥有80亿参数、情感丰富的文本转语音模型。用户可通过本地运行Python脚本或使用Hugging Face模型进行推理，生成高质量音频文件。该项目主要面向开发者，提供基于Python的命令行工具以实现高效、自然的语音合成体验。

Python

2,864

273

Other

2周前

rudder-analytics/Goodness-of-Pronounciation

基于Kaldi的Python工具，用于计算音频发音得分（GOP）。通过加载声学模型和语言模型，提取特征并计算音素级对数似然值，最终输出每个音素的概率得分、平均得分及时间戳，以JSON格式呈现结果。

Python

51

8

1个月前

THUNLP-MT/PepGLAD

PepGLAD是基于几何潜在扩散模型的完整原子多肽设计工具，支持序列-结构协同设计与结合构象生成。该仓库提供训练权重与推理代码，适用于生物信息学及药物研发领域的多肽分子建模任务。

Python

124

11

MIT License

2周前

Open-LLM-VTuber/Open-LLM-VTuber

Open-LLM-VTuber是一个本地运行的开源项目，支持跨平台。它允许用户通过免提语音交互和语音中断功能与任何大语言模型对话，并配备Live2D虚拟形象展示。该工具旨在提供沉浸式的AI语音互动体验，所有处理均在本地完成，保障隐私。

Python

11,466

1,327

Other

2周前

Jane-xiaoer/claude-skill-video-transcribe

AI驱动的视频转录工具，支持YouTube、B站及本地文件。优先抓取字幕，无字幕时通过Gemini或mlx-whisper引擎转写，并提供摘要与笔记功能。兼容Claude Code等Agent，实现自然语言调用。

Python

178

32

3周前

类库

文库