方案一:
原文:
AI 数字人制作(方案一)_哔哩哔哩_bilibili
AI 文字和图片生成数字人(输入一张图片和一段文字即可生成数字人)
《用三个开源项目整合成可以商用的数字人项目》
文本生成语音开源地址:https://github.com/weineng-zhou/text2voice
语音驱动表情和嘴型开源地址:https://github.com/YuanxunLu/LiveSpeechPortraits
动作迁移开源地址:https://github.com/yoyo-nb/Thin-Plate-Spline-Motion-Model
Text+Image2DigitalPerson (浪子之心科技 卢瑞 )
1、输入文字 —— 输入” text-input”
2、将文字转化成语音 —— 输出 “voice-output”
3、输入——“voice-output”到语音驱动嘴唇及表情
4、用语音驱动嘴唇及表情( LiveSpeechPortraits) —— 输出“LiveSpeech-output”
5、输入图片 —— 输入“image-input”到Thin-Plate-Spline-Motion-Model 进行动作迁移
6、动作迁移后 —— 输出 “Moton-output”
7、最后将声音和视频合成 —— 输出 “result”
备注: 如果要商业,还需要视频融合,超分辨率,界面设计,打包部署等。
方案二:AI 数字人制作
原文:
AI 数字人制作(方案二)_哔哩哔哩_bilibili
AI 自制数字人(Wav2Lip-GFPGAN)
Wav2Lip代码地址:https://github.com/Rudrabha/Wav2Lip
GFPGAN代码地址:https://github.com/TencentARC/GFPGAN
Wav2Lip-GFPGAN代码地址:https://github.com/ajay-sainy/Wav2Lip-GFPGAN
2D,2.5D数字人制作我已经出了好几个视频,制作方法也介绍了3个以上,后期将出3D数字人的制作方法视频。
方案三:AI 数字人制作
原文:
AI 数字人制作(方案三)_哔哩哔哩_bilibili
AI 图片和语音生成数字人(国产版D_ID)
只需要进行调参就可以平替换DID,效果很好。
来自西安交大和腾讯的SadTalker,CVPR 2023年顶会论文。
开源代码地址:https://github.com/Winfredy/SadTalker