VideoAgent是一个智能视频处理框架,集成了先进的多模态AI技术,提供视频内容深度分析、自动剪辑、创意重制等一站式解决方案,帮助用户实现从理解到生成的自动化视频处理流程。
swiftGuard是一款反取证macOS托盘应用程序,通过监控USB端口来保护系统安全,防止恶意设备入侵和数据泄露。
OneTake 是一款基于AI的视频自动剪辑系统,通过语音识别将视频转换为可编辑文本,支持像编辑文档一样删除文字即可剪辑对应视频片段,适用于教学、访谈、演讲等场景,提供可视化编辑界面和自动字幕生成。
txtchat是一个用于构建自主智能代理、检索增强生成(RAG)流程和语言模型驱动的聊天应用的Python框架。它可将AI代理集成到消息平台(如Rocket.Chat),实现基于大语言模型的自动化响应和内容处理。
mPLUG-DocOwl是阿里巴巴开源的多模态大语言模型家族,专注于OCR-free(无需光学字符识别)的文档理解。它能够直接处理包含文本、图表、表格的文档图像进行问答、分析和信息提取,支持多页文档处理。
这是一个基于Python的智能媒体下载器,可根据自然语言描述自动搜索和下载图片、视频片段(支持从YouTube等平台自动下载和剪辑),主要面向开发者和内容创作者。
TideScope 是一个 AI 驱动的开源协作工具,通过扫描 GitHub 仓库的 Issue、PR 和代码注释,结合大语言模型智能分析,生成技术债务星图,帮助新贡献者找到合适的任务,并协助维护者管理技术债务。
Term-Image是一个Python库,专门用于在终端中显示图像。它提供多种渲染方法,支持静态和动态图像,适用于创建终端图像查看器或增强命令行工具的可视化效果。
PlanExe是一款开源工具,可将简单的英文目标描述在约15分钟内自动生成约40页的详细战略计划(如执行摘要、甘特图、组织架构等),极大加速规划初稿的创建。它主要作为规划脚手架,但产出仍需人工打磨完善。
π³mos-SLAM是一个动态视觉SLAM系统,利用通用3D先验技术,在动态环境中实时估计相机姿态并构建地图。适用于机器人导航、自动驾驶等需要处理移动物体的场景。
本项目基于IMDb Top 100电影数据,使用Protégé构建OWL本体,通过Python和RDFLib将CSV数据转换为RDF格式,并在GraphDB中存储和查询。它展示了电影领域知识图谱的建模、数据集成和语义推理过程,适用于知识图谱工程和语义网技术的学习与演示。
这个仓库通过整合BigQuery的INFORMATION_SCHEMA和GitHub Copilot高级AI模型,让用户能用自然语言提问,自动生成数据分析查询和代码。它支持配置环境、初始化样本数据,并利用Copilot进行交互式分析,简化数据探索流程,适合数据科学家和开发者使用。
该仓库提供vmux工具的示例脚本,帮助用户在云端运行各种命令和任务,包括Python脚本、长时任务、Web服务器、协作终端、网络探针和机器学习训练等。
这是一个基于River Wayland合成器的平铺式窗口管理器,使用Python编写。提供多种布局模式、可配置的键盘快捷键、多显示器支持和9个工作空间管理等功能,适用于Wayland桌面环境。
这是一个本地化的AI婴儿监控系统,通过视频LLM技术实时分析摄像头画面,根据预设安全规则进行智能监测。当检测到规则违反时,会发出一次温和的提示音通知看护者,无需依赖云端服务。


