摘要
我们提出了一个用于点云生成的概率模型,它可以被用于多种 3d 视觉任务的基础,例如形状补全、上采样、合成和数据增强。受非平衡热力学中扩散过程的启发,我们将点云中的点视为与热库(heat bath)接触的热力学系统中的粒子,其从原始分布扩散成为噪声分布。因此,点云生成相当于学习将噪声分布转换为所需形状分布的反向扩散过程。
具体来说,我们提出将点云的反向扩散过程建模为以某种隐式形状(shape latent)为条件的马尔可夫链。我们推导出训练时封闭形式的变分边界,并提供了模型的实现。实验结果表明,我们的模型在点云生成和自动编码方面取得了有竞争力的表现。
主要贡献
文章受非平衡热力学中的扩散过程启发,提出了一种新的点云概率生成模型。 • 作者从点云基于形状的条件似然的变分下限推导出一个易于处理的训练目标。
大量实验表明我们的模型实现了在点云生成和自动编码有竞争力的性能
方法概述
本文中作者将点云看作是从概率分布中取样生成的,每一个点都是该概率分布的独立同分布(i.i.d)采样。类似于图像的扩散概率模型,当我们向点云引入噪音时,点云会逐步从与形状有关的复杂分布变为高斯分布的噪音,这一过程被称作正向扩散过程。点云的生成模型可以被视作是如图二所示的逆向扩散过程:根据一个高斯分布取样作为噪音点云,训练一个神经网络以形状为条件逐步对该噪音点云减噪,直至点云恢复其本来的形状。
figure 2 展示了从噪音点云逆扩散生成点云的过程可以由一个马尔科夫链模型表示。点云中的每一个点由 x(t) 开始以转移概率 p****θ(x(t-1)|x(t),z) 逐步减噪(逆扩散)为目标点云 x(0)。其中 θ 表示可学习的神经网络参数参数,z 表示与形状有关的潜变量。
生成点云时,从正态分布取样w,经先验flow模型映射为形状变量z。同时从正态分布取样噪音点云 x(t)。通过一系列逆向扩散过程,噪音点云以形状z为条件逐渐减噪为目标点云 x(0)。
训练时,数据集中的点云经过编码器 φ 编码为形状潜码 z 正态分布的均值和方差,再使用与变分编码器(vae)中的重新参数化技巧相同的方式取样形状潜码 z。如下图所示,输入点云随后经过一系列前向扩散过程逐渐变为噪音点云。训练目标函数采用条件似然概率的变分下限,以最大化似然训练数据集的似然概率。
需要注意的是,变分自动编码器vae的先验概率选用正态分布,本文应用 flow 模型将简单的正态分布映射 p(w) 到更复杂的分布模型 p(z)。训练时,q(z|x(0) 经过逆向的 flow 映射回 w, 损失函数包含 w 的先验概率分布和后验概率分布之间 kl 散度。
实验结果
文章选用 shapenet 数据集进行点云生成实验、点云重建以及点云特征提取实验。 table 1 总结了扩散概率模型与包括gan、flow模型在内的其他点云生成方法相比在最小匹配距离 (mmd), 覆盖分数 (cov), 最近邻分类器准确率(1-nna)以及 jenson-shannon 散度 (jsd) 上可以 sota 方法媲美。
下图展示了一些生成点云的样例,包含了飞机和椅子两个分类。
table 2 列出了扩散概率模型自动编码重建性能。其重建点云与原始点云之间的 chamfer 距离(cd) 和 动土距离 (md) 也可以达到与 sota 相近的数值。
下图给出了几个点云重构的例子,最左侧一列是真实点云,然后依次是扩散模型、shapegf 以及 atlasnet。
table 3 显示扩散概率模型与其他模型在表征学习方面的比较。只使用一个线性svm作为分类器,扩散概率模型学习的表征在modelnet10和modelnet40数据集上分别可以达到94.2%和87.6%的准确率,与sota方法相近或更好。
figure 6展示在潜变量空间插值变换获得相应点云的变化:
总结
文章将扩散概率模型用于点云生成,推理时以形状采样为条件将噪音点云逆向扩散为目标点云;训练时将输入正向扩散为噪音点云,以从点云似然变分下限推导出的损失函数训练模型。• 实验表明这样的扩散模型实现了在点云生成、自动编码以及表征学习任务实现了有竞争力的性能。
工业级液晶显示器和普通液晶电视有什么区别?
发展农业物联网需解决的三大难题
三星发布可伸缩显示屏的智能手机专利
AI预测2019奥斯卡赢家名单 准确率达94%
李兴波:萤石EZIoT服务平台 破传统行业智能化转型困局
介绍一个用于点云生成的概率模型
关于资深专家对于集成电路的未来分析
半导体二极管的多方面识别
网络变压器的分类及其在不同应用上的作用
中国私有云市场竞争力TOP5
CDMA2000 1X与HRPD混和组网的网规网优介绍
ADC芯片-模拟转换信号芯片
中国电建云数据中心正式落成运行
斑马技术助力零售商 推耐用触控式数据终端
高速链路时钟抖动规范基础知识
华硕推出一款ATX规格的B365主板 10相供电内存频率最高2667MHz
人工智能产业链最全盘点,让大家更全面的认识人工智能
如何将4K 高清的NDI视频源实现同步录制?
吉利汽车在2020年2月份的总销量情况分析
解析OLED拼接屏显示噪点问题:修复亮点和暗点的方法及注意事项