Good Question 是一个基于 Python 的 Agent Skill,旨在帮助研究者打磨科研问题。它能将模糊兴趣或文献缺口转化为结构化的研究卡片,评估问题的重要性、可行性与可证伪性,并提供领域特定的优化建议,辅助用户判断研究方向的价值。
Sprite Video Lab 是本地网页工具,用于将视频或序列帧整理为2D Sprite资源。支持抠图(绿幕、AI、亮度)、抽帧、去背景及导出Sprite Sheet。基于Python和FFmpeg,适合Windows本地工作流。
MinerU-Popo是一个轻量级通用OCR后处理框架,旨在将页面级OCR解析转化为文档级语义结构。它通过4B模型执行表格/文本截断、标题层级及图文关联分析,解决跨页几何不连续和长文档处理难题,显著提升文档树结构构建的准确性与一致性。
Miso TTS 是一个拥有80亿参数、情感丰富的文本转语音模型。用户可通过本地运行Python脚本或使用Hugging Face模型进行推理,生成高质量音频文件。该项目主要面向开发者,提供基于Python的命令行工具以实现高效、自然的语音合成体验。
基于Kaldi的Python工具,用于计算音频发音得分(GOP)。通过加载声学模型和语言模型,提取特征并计算音素级对数似然值,最终输出每个音素的概率得分、平均得分及时间戳,以JSON格式呈现结果。
PepGLAD是基于几何潜在扩散模型的完整原子多肽设计工具,支持序列-结构协同设计与结合构象生成。该仓库提供训练权重与推理代码,适用于生物信息学及药物研发领域的多肽分子建模任务。
Open-LLM-VTuber是一个本地运行的开源项目,支持跨平台。它允许用户通过免提语音交互和语音中断功能与任何大语言模型对话,并配备Live2D虚拟形象展示。该工具旨在提供沉浸式的AI语音互动体验,所有处理均在本地完成,保障隐私。
AI驱动的视频转录工具,支持YouTube、B站及本地文件。优先抓取字幕,无字幕时通过Gemini或mlx-whisper引擎转写,并提供摘要与笔记功能。兼容Claude Code等Agent,实现自然语言调用。
MoonTV每日影视精选的Python实现,基于OpenClaw架构。支持多源聚合、智能去重及五分类推荐,调用GPT-4o-mini生成亮点。纯Python独立运行,含完整测试与模块化设计,自动清理旧报告并支持追剧配置,旨在高效推送每日影视资讯。
UPTW是面向城乡规划硕士的论文写作工具,将实证研究数据整理为中文DOCX学位论文。通过持久化记忆解决长文写作中的逻辑一致、术语统一及格式漂移问题。提供/UPTW-plan和/UPTW-write命令辅助人机协作完成论文构建与修改。
Interactive3D是CVPR'24提出的交互式3D生成框架,支持通过文本、草图或图像等交互方式创建3D资产。该项目基于Python开发,旨在实现高效且可控的3D内容生成,适用于需要灵活定制3D模型的研究与应用场景。
Horizon 是一个基于 Python 的 AI 新闻雷达工具,支持多种大模型。它能自动抓取并分析新闻源,生成中英双语每日简报,帮助用户高效获取资讯。项目开源且可扩展,适合个人构建专属的新闻聚合与摘要服务。
该仓库提供面向知识工作者的开源插件,旨在增强Claude Cowork和Claude Code的能力。通过集成Slack、Jira等工具,帮助团队在生产力、销售、客服及产品设计等领域实现自动化工作流与专业化支持,提升工作效率与一致性。
Anima是一个开源的硬件智能Agent操作系统,旨在赋予家庭设备感知、决策和学习能力。它作为本地网络中的智能运行时,通过适配器连接并控制各类硬件,利用LLM大脑和长期记忆实现环境理解与用户偏好学习,将普通设备转化为协同智能体。
将Google Gemini网页版转换为OpenAI兼容API的Python工具。支持零认证、多模型选择、函数调用及流式输出,提供/v1/chat/completions等标准接口,便于无缝接入各类AI客户端与开发框架。


