类库 - Outil en ligne

naqashafzal/AI-Content-Studio

AI-Content-Studio是一个开源的YouTube自动化内容生成工具。它利用AI自动完成从选题调研、脚本撰写、语音合成、视频制作到封面生成及SEO优化的全流程，最终自动发布视频，实现无人值守的YouTube频道增长。

Python

684

160

21小时前

DepthAnything/Video-Depth-Anything

Video Depth Anything 是 CVPR 2025 Highlight 项目，基于 Depth Anything V2，专为超长视频提供高质量、高一致性的深度估计。相比扩散模型，它具有推理更快、参数更少及精度更高的优势，支持相对深度与度量深度，并具备流式处理实验功能。

Python

2,024

185

Apache License 2.0

21小时前

DepthAnything/Video-Depth-Anything cover

Emily2040/seedance-2.0

Seedance 2.0 Skill OS 是一个面向 Seedance 2.0 的全流程 AI 电影制作生产管线。它作为智能代理，能像导演一样阅读场景并生成提示词，支持文本、图像、视频及参考视频的四方模态输入，具备原生音频支持和多语言读取能力，旨在简化 AI 视频创作工作流。

Python

5,621

858

MIT License

20小时前

mhashas/Document-Image-Unwarping-pytorch

基于PyTorch的文档图像去弯曲工具，实现DocUNet算法。通过预测逆向量场提升推理速度，支持UNet、Deeplabv3+等模型及MS-SSIM损失函数，能在CPU上实现实时处理。适用于修复扫描文档的卷曲变形问题。

Python

118

20

3天前

shannanyinxiang/UPOCR

UPOCR是ICML 2024论文的统一像素级OCR接口官方实现。它是一个通用模型，通过统一范式、架构和训练策略，在文本移除、检测和分割等多种像素级OCR任务中表现优异。用户需配置Python环境并下载数据集与权重进行推理。

Python

70

7

5天前

petergyang/no-ai-slop

该工具用于移除写作中20多种典型的AI生成痕迹（如陈词滥调、虚假洞察等），同时保留作者个人风格。它不仅能检测并消除这些模式，还能在不清除个性声音的前提下提升文本的自然度和专业性，适用于各类文本编辑场景。

Python

3,526

276

MIT License

19小时前

slvDev/esp32-ai

该项目在ESP32-S3微控制器上运行拥有2890万参数的语言模型，实现完全离线文本生成。利用Flash存储和Per-Layer Embeddings技术突破内存限制，无需服务器支持，适合资源受限的边缘计算场景。

Python

2,433

288

MIT License

19小时前

Role1776/netmon

Netmon是一个自托管的轻量级网络监控工具，使用Python编写。它定期执行网速测试和局域网设备扫描，并将结果存储于SQLite。每4小时通过Telegram或Discord发送包含趋势图和AI讽刺评论的详细报告，全程本地运行，保护隐私。

Python

265

38

MIT License

1天前

lanerchenbuna/QueryForge

QueryForge是一个本地优先的AI数据分析平台，将自然语言转化为可审计的SQLite查询。它通过强制语义层、策略治理和可视化工作台，确保SQL生成的安全性与可追溯性，适用于零售、金融等数据域的分析场景。

Python

9

2

23小时前

Brandfetch/brandfetch-mcp-server

Brandfetch MCP Server是官方提供的模型上下文协议服务器，通过Python实现。它赋予AI助手访问Brandfetch API的能力，支持品牌搜索、公司信息查询、Logo获取及交易商户识别等功能，旨在为LLM提供标准化的品牌数据上下文。

Python

8

1

MIT License

3天前

Yanick112/ComfyUI-ToSVG

ComfyUI-ToSVG是VTracer的ComfyUI非官方实现，用于将光栅图像转换为SVG矢量图。支持批量处理、参数自定义及多种节点操作（如量化、简化路径），适用于设计师和开发者进行程序化矢量图形处理。

Python

311

27

MIT License

6天前

tatarize/potrace

Potrace的纯Python移植版，用于将位图转换为矢量SVG图形。旨在解决原版C语言库在多平台安装时的编译问题，具备广泛兼容性。需安装numpy和Pillow依赖，虽速度较慢但足以满足日常使用需求。

Python

166

20

GNU General Public License v2.0

5天前

muippt/mu-pdf-converter

mu-pdf-converter是一个100%本地运行的开源PDF转换工具，支持将PDF高保真转换为PPT、Word、Excel及图片。具备四层解析、三引擎表格提取、自动翻译和水印去除功能，适用于财报、合同、发票等场景的批量处理与数据提取。

Python

3

0

MIT License

1天前

joeseesun/learnui

Learn UI Name是namethatui.com的中英双语复刻版，提供62个可交互UI标本及44种视觉风格图鉴。支持搜索、测验和一键复制Prompt，旨在帮助用户精准命名UI元素并高效指挥AI编程代理，具备PWA离线访问能力。

Python

36

2

MIT License

2天前

Robbyant/lingbot-world-v2

LingBot-World 2.0是一个基于Python的先进世界建模项目，支持无限时长、高速响应的交互式视频生成。它集成了智能体框架以规划角色行为和环境事件，提供多样化动作与文本驱动事件，适用于构建动态逼真的虚拟交互世界。

Python

1,437

97

Other

21小时前

类库

文库