类库
› lingbot-va
Robbyant/lingbot-va
LingBot-VA是一个用于机器人控制的因果视频-动作世界模型项目。它通过自回归框架,统一了视觉动态预测和动作推断,旨在提高机器人操作的样本效率、长时程成功率以及对新场景的泛化能力。项目提供预训练模型和代码,支持在自定义机器人数据集上进行微调。
技术栈
查看全部依赖 (22)
依赖
NumPy
Pillow
accelerate
diffusers
easydict
einops
flash_attn
ftfy
imageio
lerobot
matplotlib
msgpack
opencv-python
safetensors
scipy
torch
torchaudio
torchvision
tqdm
transformers
wandb
websockets
截图