SadTalker: Learning Realistic 3D Motion Coefficients for Stylized Audio-Driven Single Image Talking
链接 arxiv:https://arxiv.org/abs/2211.12194 Project page:https://sadtalker.github.io/ 摘要 通过人脸图像和一段语音音频生成会说话的头部视频仍然存在许多挑战。例如,不自然的头部运动,扭曲的表情和身份修改。我们认为这些问题主要是因为从耦合的二维运动场中学习。另一方面,显式使用3D信息也存在表达生硬和视频不连贯的问题。我们…