FineVideo: behind the scenes

摘要

FineVideo数据集包含4.3万条视频,总时长3400小时,附带丰富标注,如描述、叙事细节和问答对。构建过程从190万条YouTube视频中筛选出44万条,经过语言过滤、动态内容筛选和分类标注,最终生成高质量视频数据。数据集适用于训练视频理解、生成和计算机视觉模型,旨在推动开源视频AI的发展。

欢迎在评论区写下你对这篇文章的看法。

评论

首页 - Wiki
Copyright © 2011-2025 iteam. Current version is 2.142.1. UTC+08:00, 2025-03-18 11:00
浙ICP备14020137号-1 $访客地图$