类库 › lingbot-va
Robbyant

Robbyant/lingbot-va

LingBot-VA是一个用于机器人控制的因果视频-动作世界模型项目。它通过自回归框架,统一了视觉动态预测和动作推断,旨在提高机器人操作的样本效率、长时程成功率以及对新场景的泛化能力。项目提供预训练模型和代码,支持在自定义机器人数据集上进行微调。

技术栈

查看全部依赖 (22)

依赖

NumPy Pillow accelerate diffusers easydict einops flash_attn ftfy imageio lerobot matplotlib msgpack opencv-python safetensors scipy torch torchaudio torchvision tqdm transformers wandb websockets

截图

assets/teaser_v3.png

评论

ホーム - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.1. UTC+08:00, 2026-04-03 12:31
浙ICP备14020137号-1 $お客様$