一款在Mac本地运行的AI照片整理工具,通过本地视觉语言模型自动分类照片、检测模糊和重复图像,支持自然语言搜索和本地隐私保护,帮助用户清理无用照片回收存储空间。
这是一个用于管理Claude Code技能的Python工具,主要功能包括检查技能更新、自动安装更新、推荐热门技能,以及支持多语言界面。
这是一个QGIS插件,用于浏览、可视化和下载Maxar开放数据中的卫星影像,特别针对灾难事件。它支持事件浏览、影像足迹查看、云优化GeoTIFF直接加载、影像下载及云覆盖过滤等功能,旨在辅助应急规划、风险监测和损害评估。
AnyTalker是一个音频驱动的多人说话视频生成框架,采用灵活的多流结构支持多角色交互,能够生成自然的口型同步和身份互动的说话视频。
这是一个基于DSPy框架的递归语言模型(RLM)实现,专门用于处理超长文本上下文(10万+ tokens)。通过递归探索和分段处理技术,避免传统语言模型在长文本中性能下降的问题,支持多种LLM后端,适用于需要处理大文档的AI应用开发。
ComfyUI是一个基于节点图的稳定扩散AI图像生成工具,提供模块化图形界面,用户可通过拖放节点灵活构建工作流,适用于艺术创作和AI实验。
BotWave是一个基于树莓派的FM广播网络工具,允许通过树莓派设备在FM无线电频段上广播音频。它支持服务器-客户端架构,提供远程控制、自动化操作、直播流媒体等功能,适用于学习、实验和创意项目。
UltraRAG是一个低代码MCP框架,专注于构建复杂且创新的检索增强生成(RAG)管道。它旨在通过简化开发和降低技术门槛,实现快速部署高性能RAG系统。支持知识摄取、多模态处理和统一评估等功能,适用于开发智能问答、文档分析等应用。
VideoAgent是一个智能视频处理框架,集成了先进的多模态AI技术,提供视频内容深度分析、自动剪辑、创意重制等一站式解决方案,帮助用户实现从理解到生成的自动化视频处理流程。
swiftGuard是一款反取证macOS托盘应用程序,通过监控USB端口来保护系统安全,防止恶意设备入侵和数据泄露。
OneTake 是一款基于AI的视频自动剪辑系统,通过语音识别将视频转换为可编辑文本,支持像编辑文档一样删除文字即可剪辑对应视频片段,适用于教学、访谈、演讲等场景,提供可视化编辑界面和自动字幕生成。
txtchat是一个用于构建自主智能代理、检索增强生成(RAG)流程和语言模型驱动的聊天应用的Python框架。它可将AI代理集成到消息平台(如Rocket.Chat),实现基于大语言模型的自动化响应和内容处理。
mPLUG-DocOwl是阿里巴巴开源的多模态大语言模型家族,专注于OCR-free(无需光学字符识别)的文档理解。它能够直接处理包含文本、图表、表格的文档图像进行问答、分析和信息提取,支持多页文档处理。
这是一个基于Python的智能媒体下载器,可根据自然语言描述自动搜索和下载图片、视频片段(支持从YouTube等平台自动下载和剪辑),主要面向开发者和内容创作者。
TideScope 是一个 AI 驱动的开源协作工具,通过扫描 GitHub 仓库的 Issue、PR 和代码注释,结合大语言模型智能分析,生成技术债务星图,帮助新贡献者找到合适的任务,并协助维护者管理技术债务。


