三花快讯 · 2024, 5月24日

Semantic Gaussians: 一种全新的 3D 场景理解技术

多视图图像输入,将其投影到 3D 空间中生成 3D 高斯点

一种通过多视图图像输入,将其投影到 3D 空间中生成 3D 高斯点,并映射生成语义高斯图像的新技术。

官网展示了几个实际应用案例:

  • 时空跟踪 (Spatiotemporal Tracking) :跟踪物体或人的运动
  • 部件分割 (Part Segmentation) :将物体分割成不同的部件,图中示例是一把吉他,被分割成不同颜色的部分
  • 语言引导编辑 (Language-Guided Editing) :用户可以通过自然语言指令(例如“删除玻璃瓶”)进行图像编辑

商业转载请联系三花微信公众号获得授权,非商业转载请注明本文出处及文章链接,您可以自由地在任何媒体以任何形式复制和分发作品,也可以修改和创作,但是分发衍生作品时必须采用相同的许可协议。

本文采用 CC BY-NC-SA 4.0 - 非商业性使用 - 相同方式共享 4.0 国际 进行许可。