重新想象现实:NVIDIA推出fVDB来构建更大的数字世界模型
NVIDIA在SIGGRAPH fVDB上宣布了一个新的深度学习框架,为自动驾驶汽车、气候科学和智慧城市创建了人工智能就绪的虚拟展示。
fVDB建立在OpenVDB之上,OpenVDB是一个行业标准库,用于模拟和渲染稀疏的体积数据,如水、火、烟和云。
生成式物理人工智能,如生活在现实世界中的自动驾驶汽车和机器人,需要具备“空间智能”——即在3D空间中理解和操作的能力。
捕捉我们周围世界的大规模和超精细细节是必不可少的。但将现实转化为虚拟表现来训练人工智能是很困难的。
真实环境的原始数据可以通过许多不同的,比如神经辐射场(nerf)和激光雷达。fVDB将这些数据转换为实时渲染的大规模ai就绪环境。
在OpenVDB标准十年创新的基础上,在SIGGRAPH上引入vdb代表了行业如何从现实世界的数字孪生中受益的重大飞跃。现实规模的虚拟环境用于训练自主代理。城市规模的3D模型由无人机捕获,用于气候科学和灾害规划。
生成式人工智能甚至被用于规划城市空间和智能城市。
fVDB使各行业能够以比以往更大的规模和更高的分辨率挖掘空间智能,使物理人工智能更加智能。
该框架在NanoVDB之上构建了nvidia加速的AI操作符gpu加速的数据结构,用于代客户端3D模拟。这些操作符包括卷积,池化,注意力和网格,所有这些都是为高性能3D深度学习应用而设计的。
人工智能运营商允许企业为空间智能构建复杂的神经网络,如大规模点云重建和3D生成建模。
fVDB是NVIDIA研究团队长期努力仟的成果,已经用于支持NVIDIA research, NVIDIA DRIVE和NVIDIA Omniverse项目,这些项目需要大型,复杂的现实世界空间的高保真模型。
fVDB的主要优点
- 更大:比以前的框架大4倍的空间尺度
- 更快:比以前的框架快5倍
- 可互操作:企业可以充分利用庞大的现实世界数据集。fVDB读取VDB数据集到全尺寸的3D环境。ai就绪,实时
- 渲染用于构建具有空间智能的物理AI。
- 更强大:比以前的框架多10倍的操作符。fVDB通过组合以前需要多个功能的功能来简化流程深度学习库。
fVDB将很快作为NVIDIA NIM推理微服务提供。微服务将使企业能够将fVDB纳入OpenUSD工作流程,在NVIDIA Omniverse(工业数字化和生成物理AI应用的开发平台)中生成AI-ready OpenUSD几何体。它们是:
- fVDB网格生成NIM -生成现实世界的数字3D环境
- fVDB NeRF-XL NIM -使用Omniverse云api在OpenUSD中生成大规模nerf
- fVDB Physics Super-Res NIM -执行超分辨率生成基于openusd的高分辨率物理模拟
在过去的十年中,OpenVDB作为核心赢得了多个奥斯卡奖
整个视觉发展影响行业使用的技术。从那以后,它已经从娱乐发展到工业和科学用途,比如工业设计和机器人。
NVIDIA继续增强开源的OpenVDB库。四年前,公司推出了NanoVDB,它为OpenVDB添加了GPU支持。这提供了一个数量级的加速,实现更快的性能和更容易的开发,并打开了实时模拟和渲染的大门。两年前,NVIDIA推出了NeuralVDB,它在NanoVDB之上构建机器学习,将VDB卷的内存占用压缩到原来的100倍。创作者、开发人员和研究人员与极其庞大和复杂的数据集进行交互。
fVDB在NanoVDB之上构建人工智能运营商,以现实规模解锁空间智能。申请早期访问程序以访问fVDB PyTorch扩展。fVDB也将作为OpenVDB GitHub存储库的一部分提供。
在这个技术博客(Building Spatial Intelligence from Real-World 3D Data Using Deep-Learning Framework fVDB | NVIDIA Technical Blog)中深入了解fVDB,并在NVIDIA首席执行官黄仁勋在SIGGRAPH的炉边聊天中观看加速计算和生成人工智能如何改变行业,并为创新和增长创造新的机会。