Velox:搞懂4D几何和外观咋表示

搞了个学4D物体潜在表征的框架。这表征得能描述物体,把几何和外观都抓住;还得压缩得好,方便下游任务;而且获取要简单,给个非结构化的动态点云就能建。具体说,Velox训个编码器,把时空彩色点云压成一组动态形状标记。这些标记过俩互补的解码器:一个4D表面解码器,建模随时间变的表面分布来抓几何;另一个高斯解码器,把标记映射到3D高斯分布,帮着学外观。为了看看这表征有没有用,我们拿了三个下游任务测——视频生成4D、3D跟踪,还有靠图像生成4D来模拟布料——结果都挺好。

  • † 多伦多大学

别的相关文章。

我们琢磨这么个问题:对于一个没见过真容的刚性物体,在不知道它3D模型的情况下,怎么在线实时地给它的部分点云做配准。点云是部分的,因为它是深度传感器抓的,只拍到某个角度看过去的部分。这就带来俩主要麻烦:1) 俩部分点云对不上;2) 当可见部分……

看更多

在3D点云里准确定位物体是不少应用的核心,比如自动导航、扫地机器人,还有AR/VR。为了把特别稀疏的LiDAR点云和区域提议网络(RPN)接上,现在大部分活儿都集中在手工整的特征表示上,比如鸟瞰图投影。我们这活儿里,我们不用……

看更多

mark一下,回头再细看

这东西就那样

小白问一下,这个4D指的是三维空间加上时间轴吗?是不是用来处理动态3D物体的?我不太确定这样理解对不对。

昨天刚试了用3D高斯分布做外观建模,确实比传统体素方法节省显存,不过训练时间还是有点长。看到文章里提到高斯解码器,感觉思路挺像的,但把几何和外观拆成两个解码器会不会增加融合的难度?有没有试过统一成一个网络?

又来这种帖子了,动不动就“结果都挺好”,实际跑起来数据预处理就得折腾两天

我最近正好在做动态点云压缩的项目。简单说下步骤:先对点云序列做时序对齐,然后用基于Octree的方法编码,最后用一个小型Transformer做帧间预测。效果还行,但解码端延迟还是偏高。

这周末苹果好像有打折,有人抢到吗?

具体怎么训练这个编码器的?点云输入需要先做归一化吗?还有动态形状标记的数量是固定的还是自适应的?如果点云序列长度变化很大怎么处理?追问一下损失函数的设计,几何和外观两个解码器的loss权重是手动调的还是自动学的?

4D表征这块最近论文真不少,不过能跑demo的没几个

同mark,主页那几个demo效果看着挺真实的