3D-Fixer是基于单张图像生成高保真3D场景的开源项目。它采用粗到细的就地补全范式,利用碎片几何作为空间锚点,无需逐场景优化即可快速生成完整3D资产,具有高质量和高泛化性。
基于Whisper AI的多后端转录应用,支持本地文件或URL输入。具备极速性能、Mac-arm优化及完全隐私免费特性。自动生成speaker.json实现说话人分离,提供简易安装体验,适用于Windows和Mac平台。
SDAR是自我蒸馏智能体强化学习方法的官方代码,旨在提升ALFWorld、WebShop等环境中的RL性能。该仓库提供完整的安装指南与实验脚本,适用于研究人员复现论文结果及进行相关算法开发。
面向商业分析师的AI数据分析智能体,支持自然语言交互。用户上传Excel/CSV或连接数据库后,系统自动执行SQL查询、生成图表并提供业务洞察,旨在让非技术人员通过对话完成复杂数据分析。
DreamLite是一个轻量级端侧统一模型,支持文生图与图像编辑。它采用0.39B参数,在iPhone等设备上实现4步推理、约3秒生成1024x1024图片,完全离线运行,无需云端依赖。
buddyMe是Python实现的轻量级AI智能体框架,支持多模型热切换、分层人格、三级技能加载及心跳记忆系统。具备复杂任务自动拆解执行、内置工具与25+预置技能、持久记忆及定时调度能力,适用于编程助手或通用任务代理开发。
MM-Agent是一个基于大语言模型的智能体系统,专为解决现实世界数学建模问题而设计。它利用LLM作为智能体,实现自动化问题解决、智能代码生成及数据处理,旨在提升数学建模的效率与准确性,适用于学术研究及实际应用场景。
这是一个关于Claude Code的全面实战指南,涵盖安装、提示工程、技能、钩子、MCP及多智能体自动化。通过清晰的心智模型和真实案例,帮助开发者从入门到精通,掌握高效工作流与团队协作策略。
ShadowBroker是一个开源的全球情报聚合平台,整合60+实时公开数据源(如航班、卫星、地震等),提供统一的暗操作地图界面。支持35+数据层切换及多种视觉模式,旨在帮助分析师和研究者通过单一界面可视化全球公共信号与地缘政治事件。
基于开源LLM和E2B桌面沙箱的AI自动化计算机操作工具。通过键盘、鼠标和Shell控制云端Linux环境,支持多模型集成与实时屏幕流式传输,允许用户随时暂停并干预,实现安全的AI驱动计算机使用。
Graph-R1是一个基于端到端强化学习的Agentic GraphRAG框架,旨在提升大语言模型的图推理能力。通过构建知识超图和迭代推理循环,有效结合结构化知识与LLM,适用于医疗、金融等知识密集型领域的复杂问答任务。
StreamDiffusion是一个面向实时交互式图像生成的创新扩散模型流水线。它通过流式批处理、残差无分类器引导和随机相似度过滤等技术,显著提升生成性能与GPU利用率,旨在实现高效、低延迟的实时图像创作体验。
rPPG-Toolbox是一个基于Python的开源平台,用于摄像头生理信号感知(远程光电容积脉搏波)。它集成了多种先进的神经和无监督算法进行基准测试,并支持用户快速开发和自定义算法,适用于心率等生理参数的非接触式测量研究。
OctoTools是一个基于Python的代理框架,提供可扩展工具以支持复杂推理任务。它允许开发者构建和集成智能体,具备强大的工具扩展能力,适用于需要深度逻辑分析和多步骤决策的场景,并支持Ollama等本地模型部署。
AirSim360是基于虚幻引擎5的高保真全景无人机仿真平台,提供360度视角的闭环飞行模拟。它解决了大规模全景无人机数据的缺失问题,支持多模态导出,适用于计算机视觉研究和算法训练。


