卡卡字幕助手是一款基于大语言模型(LLM)的视频字幕智能处理工具,支持语音识别、字幕智能断句、校正优化和翻译的全流程处理。提供图形界面,支持API和本地离线两种方式,操作简单,可一键生成高质量字幕。
FunClip 是一个开源、准确的视频语音识别与剪辑工具,集成了基于 LLM 的 AI 剪辑功能。它利用阿里巴巴的 FunASR Paraformer 模型进行语音识别,用户可从识别结果中选择文本或说话者片段,快速生成对应视频剪辑,支持本地部署。
HouseTour是一个虚拟房地产AI系统,基于ICCV 2025的研究成果,能够从一组图像中生成空间感知的3D相机轨迹和自然语言描述,为现有3D空间创建虚拟导览视频。
Warlock Studio是一个基于Python开发的Windows桌面应用程序,集成了Real-ESRGAN、GFPGAN、RIFE等多种AI模型,专注于图像和视频的批量超分辨率放大、人脸修复、去噪、帧率提升(插帧)等处理,支持GPU加速,提供一站式多媒体增强解决方案。
这是一个基于GitHub Issues构建的个人博客系统,主要用于发布技术文章。内容涵盖AI/LLM、量化推理、GPU算力、Kubernetes、SRE运维等主题,将Issues作为文章管理平台。
这是一个基于Web的应用程序,用于从YouTube视频中创建大规模的埃及阿拉伯语自动语音识别(ASR)数据集。它支持监控YouTube频道、提取高质量音频、使用Google Gemini进行AI转录、语音活动检测、字幕对齐和数据集导出等功能,并提供一个现代UI仪表板进行实时进度跟踪。
Trail of Bits提供的Claude Code插件市场,专注于增强AI辅助的安全分析、漏洞检测和审计工作流。包含智能合约安全扫描器、代码审计工具等插件,帮助安全研究人员和开发者提高效率。
这是一个轻量级的开源项目,作为Windows操作系统与AI助手之间的桥梁,实现了AI智能体与Windows系统的无缝集成。主要功能包括文件导航、应用程序控制、用户界面交互、质量保证测试等自动化操作,支持MCP协议,可集成到Claude Desktop等平台使用。
MemR3是一个基于记忆推理的智能检索系统,专门用于回答长对话中的问题。它支持RAG(检索增强生成)和Zep图搜索两种后端,通过动态路由和证据追踪实现精准检索与自主迭代优化。
Bub 是一个基于 `republic` 构建的代码助手命令行工具,专为需要可预测、可检查和可恢复执行的真实工程工作流而设计。它严格区分自然语言指令与命令行命令,提供会话上下文记录和管理功能,并可通过 Telegram 集成进行远程交互。
APKLeaks是一个用于分析安卓APK文件的工具,主要功能是扫描APK中的URI、端点以及敏感信息(如密钥、令牌等),帮助进行安全审计或漏洞挖掘。
Qwen3是由阿里云通义千问团队开发的大型语言模型系列,提供多种参数规模的开源模型,支持本地部署、量化推理和微调训练。
ACE-Step 1.5是一个强大的开源音乐生成模型,可在消费级硬件上本地运行。它能根据简短的文本描述快速生成高质量音乐,支持从短循环到10分钟长的作品,并可通过少量歌曲进行个性化风格微调(LoRA)。
ArcFlow是一种创新的两步文本到图像生成框架,通过高精度非线性流蒸馏技术,显著减少扩散模型的推理步数,在保持高质量图像生成的同时大幅提升生成速度。它使用动量混合过程来模拟教师模型的复杂轨迹变化。
Strix是一个开源AI安全工具,通过自主运行的AI黑客代理来查找和修复应用程序漏洞。它能与GitHub Actions和CI/CD流程无缝集成,自动扫描每个拉取请求的漏洞,阻止不安全代码进入生产环境。


