三花快讯 · 2024, 8月26日

Meta sapiens:全新以人为中心的视觉模型

2D Pose、Seg、Depth、Normal

"真 Open" 的 Meta 开源了他们的 Sapiens 模型,一个专门用来识别人的模型,包括:

  • 2D 姿态估计(识别人身体的姿势)
  • 身体部位分割(区分身体的各个部分)
  • 深度估计(确定物体距离的远近)
  • 表面法线预测(判断物体表面的方向)

我愿再称小札为赛博佛祖!可以预知,很快就会有相关的 ControlNet 预处理器出现了!

商业转载请联系三花微信公众号获得授权,非商业转载请注明本文出处及文章链接,您可以自由地在任何媒体以任何形式复制和分发作品,也可以修改和创作,但是分发衍生作品时必须采用相同的许可协议。

本文采用 CC BY-NC-SA 4.0 - 非商业性使用 - 相同方式共享 4.0 国际 进行许可。