这是一个基于深度学习的动画角色图层分解工具,能够将单张动漫人物图片自动分解为多个可编辑的语义图层(如头发、面部、服装等),最多支持23层,并推断绘制顺序,从而将静态插图转换为可操控的2.5D模型。
SHAP 是一个基于博弈论Shapley值的机器学习模型解释工具,用于解释任何机器学习模型的输出,通过特征贡献度分配提供直观可解释性。
MLOps Zoomcamp是一个免费的9周MLOps在线课程,专注于机器学习服务从训练到部署与监控的全流程生产化实践。课程包含结构化模块、实践工作坊和最终项目,适合希望掌握MLOps核心概念与工具的数据专业人士。
该仓库是《智能体设计模式:构建智能系统实践指南》一书的配套资源库,提供了完整的书籍PDF和章节代码笔记本,专注于教授构建AI智能体系统的21种设计模式和实战技术,包括提示链、路由、多代理系统等核心内容。所有版税将捐赠给慈善机构。
GenMedia Creative Studio是一个基于Google Vertex AI的多媒体生成演示工具,利用Imagen、Veo、Gemini、TTS、Lyria等API提供文本、图像、视频、音频的生成功能。主要用于演示和实验,不适用于生产环境。
这是一个用于量化交易策略研究的开源项目,主要包含基于Jupyter Notebook实现的实验性交易策略和市场分析模型。项目旨在探索非传统的量化技术,包括传统图表分析和现代机器学习方法,强调教育目的而非实际投资建议。
MolmoWeb是一个开源的多模态网页智能代理,能够理解自然语言任务并自主控制浏览器(点击、输入、滚动、导航)完成任务。包含代理代码、推理客户端、评估基准等完整资源。
SceneGen是一个基于单张图像快速生成3D场景的AI模型,通过前向传播一步完成3D场景生成。提供完整的PyTorch实现,包含训练、推理代码和预训练模型,适用于3D内容生成研究与应用。
这是一个基于Transformers和Optimum的Whisper音频转录CLI工具,通过flash-attn等技术实现极速本地转录,可在不到98秒内转录2.5小时音频。
这是一个包含OpenVINO™工具包教程的Jupyter Notebook集合,用于学习和实践深度学习推理优化。它提供了从基础到应用的代码示例,帮助开发者快速掌握OpenVINO API的使用。
GTSAM是一个用于机器人和计算机视觉的C++平滑与建图(SAM)库,使用因子图和贝叶斯网络作为核心计算范式,替代稀疏矩阵方法,主要解决位姿估计、SLAM等问题。
TADA是一个开源的语音语言模型,通过文本-音频双重对齐框架,实现高保真语音合成和生成。它采用创新的分词器与架构设计,将语音和文本同步为统一流,显著降低计算开销,适用于多种语音处理任务。
LocoOperator-4B是一个基于Qwen3-Coder-Next蒸馏的4B参数代码库探索智能体,旨在作为本地副代理,实现快速、零API成本的代码库导航和分析。
这是一个基于迪杰斯特拉算法的追捕模拟项目,模拟小偷(车A)和警察(车B)在加权有向图上的追逐场景。项目包含动态事件(交通堵塞、道路封锁、单向通行变化)的模拟,并提供可视化和日志记录功能。
这是一个RAG投毒安全实验项目,通过将恶意数据注入向量数据库来演示如何污染检索增强生成系统。包含Flask界面、FAISS向量存储和轻量级演示,帮助学习RAG架构、攻击面、投毒技术及防御策略。


