Media2Face: 多模态引导的同声面部动画生成 | 三花 AI | 免费 AI 应用 | 1000+ AI 导航合集

Media2Face 通过（GNPFA）实现从语音到 3D 面部动画的高效合成。GNPFA 利用变分自编码器将面部表情与身份分离，创建了一个泛化的表达潜在空间，提高了面部动画的现实感和表达性。构建 M2F-D 数据集，是一个大型且多样化的 3D 面部动画数据集，包含了丰富的情感和风格标注。Media2Face 模型能够接受音频、文本和图像的多模态输入，生成与语音同步的面部动画。通过关键帧提取和风格提示，支持对生成的面部动画进行精细的控制和微调。

商业转载请联系三花微信公众号获得授权，非商业转载请注明本文出处及文章链接，您可以自由地在任何媒体以任何形式复制和分发作品，也可以修改和创作，但是分发衍生作品时必须采用相同的许可协议。

本文采用 CC BY-NC-SA 4.0 - 非商业性使用 - 相同方式共享 4.0 国际进行许可。

Llama3：中文微调合集

收集了各种网友及厂商微调、魔改版本有趣权重 & 训练、推理、部署教程视频 & 文档。

pinokio ：简化本地运行开源模型

pinokio 是一款开源、跨平台的浏览器，允许用户通过 GUI 在本地计算机上安装、运行和自动化 AI 模型。