AI 数字人制作（方案一）：输入一张图片和一段文字即可生成数字人

Post author:xfxia
Post published:2023年8月23日
Post category:其他

方案一：

AI 文字和图片生成数字人(输入一张图片和一段文字即可生成数字人)

《用三个开源项目整合成可以商用的数字人项目》

文本生成语音开源地址：https://github.com/weineng-zhou/text2voice

语音驱动表情和嘴型开源地址：https://github.com/YuanxunLu/LiveSpeechPortraits

动作迁移开源地址：https://github.com/yoyo-nb/Thin-Plate-Spline-Motion-Model

Text+Image2DigitalPerson （浪子之心科技卢瑞）

1、输入文字 —— 输入” text-input”

2、将文字转化成语音 —— 输出 “voice-output”

3、输入——“voice-output”到语音驱动嘴唇及表情

4、用语音驱动嘴唇及表情（ LiveSpeechPortraits） —— 输出“LiveSpeech-output”

5、输入图片 —— 输入“image-input”到Thin-Plate-Spline-Motion-Model 进行动作迁移

6、动作迁移后 —— 输出 “Moton-output”

7、最后将声音和视频合成 —— 输出 “result”

备注：如果要商业，还需要视频融合，超分辨率，界面设计，打包部署等。

方案二：AI 数字人制作

原文：

AI 数字人制作(方案二)_哔哩哔哩_bilibili

AI 自制数字人(Wav2Lip-GFPGAN)

Wav2Lip代码地址：https://github.com/Rudrabha/Wav2Lip

GFPGAN代码地址：https://github.com/TencentARC/GFPGAN

Wav2Lip-GFPGAN代码地址：https://github.com/ajay-sainy/Wav2Lip-GFPGAN

2D，2.5D数字人制作我已经出了好几个视频，制作方法也介绍了3个以上，后期将出3D数字人的制作方法视频。

方案三：AI 数字人制作

原文：

AI 数字人制作（方案三）_哔哩哔哩_bilibili

AI 图片和语音生成数字人（国产版D_ID）

只需要进行调参就可以平替换DID，效果很好。

来自西安交大和腾讯的SadTalker，CVPR 2023年顶会论文。

开源代码地址：https://github.com/Winfredy/SadTalker

方案一：

方案二：AI 数字人制作

方案三：AI 数字人制作

你可能也喜欢