JoyGen：音频生成逼真的3D说话人脸视频 - Online Tools

Online Tools

Online Tools

反馈

Library Code Library Shop

More

JoyGen：音频生成逼真的 3D 说话人脸视频

出处：mp.weixin.qq.com

摘要

本文介绍了一种名为JoyGen的音频驱动嘴型视频编辑技术，通过两阶段框架实现音频驱动的唇部动作生成和视觉外观合成。利用3D重建模型和音频特征，结合面部深度图，提升音频嘴型同步和视觉质量。实验在HDTF和自建中文数据集上进行，结果显示JoyGen在同步性和视觉质量上表现优异。

阅读原文

xiaozi 于 2025-07-01 分享

2843

关联话题： #京东

欢迎在评论区写下你对这篇文章的看法。

评论

据说喜欢分享的,后来都成了大神

国别域名注册8折优惠

vultr activity

tencent

他没那么爱你，只是睡你比嫖来得便宜。

文库

更多

Home - Wiki
Copyright © 2011-2026 iteam. Current version is 2.155.2. UTC+08:00, 2026-07-25 14:16
浙ICP备14020137号-1 $Map of visitor$