cover_image

AIGC视频生成趋势报告(下篇):国内产品评析与总结

LitGate团队 LitGate
2025年01月17日 09:53

一、国内产品


01

可灵

可灵是快手推出的AI视频产品,团队规模20人左右,高级副总裁盖坤、视觉生成与互动中心负责人万鹏飞带队。整体来说可灵是走的复刻Sora方案的路子,品效处于目前生成模型的第一梯队。

图片


24年6月推出可灵1.0,支持文生视频、图生视频、视频续写,半年内迅速迭代,陆续推出可灵1.5与可灵1.6,进一步升级基座模型,支持2K画质、一致性、运动笔刷等功能。

图片


可灵整体来说场景和人物的控制都相当出色,其推出的首部AIGC微短《山海奇景》热度不错,播放量5千万+;设计师自发创作的《白骨精传》播放量2千万+。

图片


Q3财报显示可灵目前使用人数超过500万,海内外访问量超过1500万,营收突破千万。不过模型在一些细节上仍旧存在局限,偶尔存在变色、闪烁,物理交互规则失效的情况。

图片


02

海螺AI

海螺AI是由Minimax推出的模型。2024年9月,海螺AI推出的abab-video-1视频模型,架构采用MOE+Linear Attention,给产品带来了高压缩率、优质文本响应、多样风格和高分辨率的电影质感等特点,在视频生成领域表现出色,引爆海外市场并带动访问量增长800%,凭借强大的技术创新和市场表现,成功登顶全球与国内AI产品增长榜单。


母公司Minimax成立于2021年12月,由商汤科技前副总裁创立,团队规模已达300人,专注于自研通用大模型。公司产品包括Glow、星野、Talkie等互动工具,以及生产力工具海螺AI,目前获得腾讯、阿里8.5亿美元投资,估值25亿美元。


整体来说底层技术有一些自研改良,品效处于第一梯队。其角色表演最为亮眼,情绪饱满稳定性强,图生视频动作较为自然流畅,时长仅6秒。

图片


MiniMax官方也曾举办过AI视频挑战赛,海外用户制作电视风格外星人视频观看量 278 万。

图片


产品海外热度较高,登顶后火速追赶可灵,月访问量在1600万上下。不过在生成过程中也会有诸如多角色场景不稳定以及动作模拟不稳定的情况。

图片


03

智谱清影

智谱人工智能公司2019年成立,源自清华技术成果,深耕大模型领域。公司在24年7月正式上线“智谱清影”,8月开源AI视频模型 CogVideoX,11月推出新清影 CogVideoX1.5 和音效模型 CogSound,实现10s时长并支持4k60超高清画质,并且自带音效,整体品质稍逊第一梯队,可控性一般,角色动作和物理模拟略有提升,市场热度较低。

图片


04

Vidu

生数科技于2023年3月成立,源自清华大学AI研究院,团队规模100+,多次融资数亿元。22年9月发布Diffudion+Transformer融合架构U-ViT,24年4月发布Vidu、性能对标Sora,24年7月Vidu正式上线,支持16秒、1080p高清视频。24年11月推出最新版本Vidu-1.5,支持文本或者图片生成视频,效果上能实现多主体一致性生成,并且能保证高品质,在上传多个参考图片时能保持多个主体稳定,适合商业广告和动漫创作。虽然在免费版720p测试上由于中间帧不稳定导致画面有点模糊,但总体上视频质量处于第一梯队,商业广告和动漫创作效果较好,实测需多次抽卡。

图片


05

PixVerse

爱诗科技于2023年4月成立,24年3月完成超亿元A轮融资,公司专注于AI视频生成模型及应用。24年1月发布PixVerse网页版,位列2月全球AI产品增速榜首,4月发布C2V大模型(Character to Video角色一致性),7月发布PixVerse V2,10月全球上线PixVerse V3,文本/图片生视频可控性尚可、品效接近第一梯队,近期凭借 “毒液变身”酷炫特效短暂火爆出圈。整体流量一般,月访问量仅有300-400万,大幅落后Kling、海螺。

图片


06

即梦

即梦作为字节的看家产品,在9月发布了看家的PixelDance、SeedWeed两个模型,并且同步上线了即梦、剪映。目前全球月访问量在240万上下,市场热度并不算高。即梦在运动控制方面有着不错的效果,可以支持生成人物的复杂连续动作,动作的连贯性在一众视频生成产品中脱颖而出,并且支持多镜头组合,镜头的变焦效果也不错。虽然支持配音,但是自带的配音效果比较差,实际的可用性要弱很多。

图片


07

混元

HunyuanVideo是腾讯推出的开源视频模型,基于DiT推断多个参数,宣称文本理解、运动质量、视频质量较好,实际测试效果一般、明显弱于第一梯队,网页端数据也较差。

图片

2024年12月3日发布,GitHub上累计获得4.7K星,具备每个视频生成5秒、生成时间约5分钟的特点。混元目前已上线其主推元宝APP,免费体验版本提供每日6个视频生成,元宝用户月活跃量达到100w,日活10w,大幅落后豆包月活4800w、日活946w。

图片


二、总结

总体来看,Kling、海螺、Runway Gen-3、Sora在视频质量、内容可控性方面处于第一梯队,初步实现商业化;物理模拟、长视频所有产品均未克服,需大量抽卡、筛选拼接。

图片


国内厂商复刻Sora方案,结合自身视频数据储备,卷画面品质、可控性、多主体一致、变焦等实用功能,大大提升AIGC视频生成的可用性;而海外厂商在产品化方面较为滞后。

图片


AIGC视频生成技术的进步得益于多个因素的共同推动。首先,视频格式的标准化为视频生成提供了基础设施的支持,使得生成过程中的参数控制和效果呈现更为统一和可操作。其次,随着大规模数据集的普及,视频样本量的充裕为AI训练模型提供了大量的高质量数据,进一步提高了生成效果的准确性和多样性。标注难度相对较低也是一大优势,视频内容可以通过相对简单的标注方法进行训练,使得AI能够在较短时间内实现较高的生成质量。


随着Scaling Law的不断发挥效应,AIGC视频生成技术正在快速发展,并有望迎来突破性进展。类似GPT-3.5和MJ(MidJourney)在文本和图像生成领域的影响,视频生成也将随着模型规模的扩大和技术的进步,迎来其“时刻”。在这一过程中,技术发展的顺序大致呈现出“文本 > 图片 > 视频 > 3D模型”的趋势,即文本生成作为最先突破的领域,逐步推动了图像生成的成熟,而视频生成的技术突破也已初见端倪,未来有望在3D模型生成方面继续扩展应用。随着技术的不断进化,AIGC视频生成将逐步走向更高水平,带来更加丰富和真实的内容创作体验。

图片


关于LitGate

大家好,我是LitGate,一个专注于AI创作的游戏社区。我们的新版官网已经上线✨你可以在里面找到各种AI创作的实操案例,以及已经沉淀的AI游戏创意demo,相信一定能让你大开眼界!


我们还有一个讨论群📣,如果你对AI创作感兴趣,或者有什么问题想要咨询,欢迎加入我们的讨论群,和大家一起交流学习!(PS:目前群内人数较多,为了有一个优质的讨论环境,请各位添加社区管理员企业微信账号邀请入群


更多精彩活动和功能筹备上线中,敬请期待~


关注我们,一起探索AI创作的无限可能吧!


新版官网地址:www.litgate.ai

图片



继续滑动看下一个
LitGate
向上滑动看下一个