MinerU-Diffusion是一个基于扩散模型的文档OCR框架,它将传统的自回归解码替换为块级并行扩散解码,实现了快速、鲁棒且具有布局感知能力的文档文字识别。
这是一个将Claude AI与Obsidian笔记软件集成的知识管理工具。它能自动读取用户提供的资料源,提取关键概念和实体,构建结构化的知识库,并支持智能问答和知识库维护。
SOMA Retargeter是一个将人类运动捕捉数据(BVH文件)转换为类人机器人关节动画的库。它使用GPU优化的逆向动力学技术,通过NVIDIA Warp进行高性能计算,处理人体与机器人的比例缩放、关节限制求解和脚部稳定等问题。输出为机器人可用的CSV关节数据,目前主要支持Unitree G1机器人。
这是一个Claude Code插件,能将模糊的软件想法转化为结构化的独立组件,为后续详细规划做准备。它通过AI辅助访谈和分解,确保系统性地思考软件的主要构成部分,是深度规划流程的第一步。
SceneTok是一个用于3D场景压缩和生成的工具。它将3D场景编码为压缩的、可扩散的一维令牌表示,并支持从新视角渲染场景。适用于3D场景重建、生成和编辑任务。
Cochise 是一个使用大语言模型(LLM)自动对微软活动目录网络进行渗透测试的Python原型工具。它通过LLM自主规划攻击链、执行命令、收集凭证并最终获取域管理员权限,旨在提供一个简洁、可读的代码基准,便于二次开发、模型能力评估和学习。
TransPixeler是一个文本到RGBA透明视频生成工具,通过扩展预训练视频模型实现包含Alpha通道的视频生成,适用于视觉特效、娱乐、广告等领域。
LeJEPA是一个开源的自监督学习框架,基于联合嵌入预测架构,无需启发式方法即可进行可证明和可扩展的视觉表示学习。主要用于图像分类任务的模型训练和评估,提供ViT和ConvNeXt等架构的实现。
MathCode是一个终端AI编程助手,专注于数学问题解决。它能将自然语言描述的数学问题自动转换为Lean 4定理并尝试进行形式化证明,内置数学形式化引擎,适用于数学研究和形式验证。
这是Karpathy autoresearch项目的苹果芯片(MLX)移植版本,在Mac上实现自主AI研究循环。通过修改训练脚本并在5分钟内评估效果,让编码代理自动进行模型优化实验,无需依赖PyTorch或CUDA。
AgentUp是一个AI代理平台,旨在将AI代理的构建、部署和管理变得像Docker一样便携、可扩展和安全。它简化了AI代理的开发和运维,使其具备不变性、可重现性和易于管理的特性。
Giskard 是一个用于评估和测试 LLM 智能体的开源 Python 库,专注于对其进行红队测试、生成测试用例及 RAG 评估。它采用模块化、轻量级设计,支持动态、异步优先的测试流程。
mac-code是一个免费运行大型AI模型的工具,专为Mac设计。它通过闪存分页技术,在内存有限的Mac上运行超出现有RAM容量的大模型(如35B参数模型),实现本地部署而无需月费。支持多种量化配置,提供不同速度与精度的平衡。
谷歌DeepMind开发的Gemma开源权重大型语言模型库,基于JAX实现,提供模型加载、推理和微调功能的Python库,支持多轮对话和多模态交互。
OpenAI Evals是一个用于评估大语言模型(LLM)及其系统的框架,并提供公开的基准测试库。用户可运行预设评估项来测试模型各方面表现,也能基于自身需求和数据编写私有评估,用以精确衡量和比较不同LLM版本在实际应用场景中的效果。


