AI走向实体:新的NVIDIA NIM微服务将生成式AI带入数字环境

生成物理AI NIM微服务和NVIDIA Metropolis参考工作流程正在帮助创建智能的沉浸式工作环境。

数百万人已经在使用生成式人工智能来辅助写作和学习。现在,这项技术还可以帮助他们更有效地仟驾驭现实世界。

NVIDIA在SIGGRAPH上宣布了生成物理人工智能的最新进展,包括用于构建交互式可视化人工智能代理的NVIDIA Metropolis参考工作流程和新的NVIDIA NIM微服务,这些微服务将帮助开发人员训练物理

机器和改进它们处理复杂任务的方式。

其中包括支持NVIDIA新深度的三个fVDB NIM微服务、3D世界的学习框架,以及USD代码,USD搜索和USD验证NIM微服务与通用场景描述(OpenUSD)的工作。

NVIDIA OpenUSD NIM微服务与世界上第一个OpenUSD开发的生成式人工智能模型——也由NVIDIA开发——使开发人员能够将生成式人工智能副驾驶和代理集成到USD中工作和拓宽3D世界的可能性。

NVIDIA NIM微服务改变物理AI景观物理人工智能使用先进的模拟和学习方法来帮助机器人和其他工业自动化更仟有效地感知、推理和导航它们环境。这项技术正在改变制造业和零售业等行业医疗保健,以及利用机器人、工厂和仓库推进智能空间技术、外科人工智能代理以及能够更自主、更精确地操作的汽车。

NVIDIA o仟提供针对特定模型和行业领域定制的广泛NIM微服务。NVIDIA为物理AI支持量身定制的NIM套件语音和翻译,视觉和智能,逼真的动画和行为的能力。

使用NVIDIA NIM将视觉AI代理变成梦想家

视觉人工智能代理使用计算机视觉能力来感知物理世界并与之交互,并执行推理任务。

高度感知和互动的视觉人工智能代理是由一类新的生成式人工智能模型称为视觉语言模型(VLMs),它是数字化的桥梁物理人工智能工作负载中的感知和现实世界交互,以增强决策、准确性、交互性和性能。通过vlm,开发人员可以构建视觉AI代理,即使在复杂的环境中,也可以更有效地处理具有挑战性的任务。

基于生成式人工智能的视觉人工智能代理正迅速部署在医院、工厂、仓库、零售商店、机场、交通枢纽等场所。为了帮助物理AI开发人员更轻松地构建高性能、自定义可视化AI代理,NVIDIA o仟为物理AI提供了NIM微服务和参考工作流程。NVIDIA Metropolis参考工作流程为定制、构建和部署可视化AI代理提供了一种简单、结构化的方法,详见博客。

(Build VLM-Powered Visual AI Agents Using NVIDIA NIM and NVIDIA VIA Microservices | NVIDIA Technical Blog)

NVIDIA NIM帮助K2K使巴勒莫更E代客户,安全,可靠

意大利巴勒莫(Palermo)的城市交通代经理部署了使用NVIDIA NIM的视觉人工智能代理,以发现物理洞察,帮助他们更好地管理道路。

​K2K是NVIDIA Metropolis的合作伙伴,是整合NVIDIA NIM的e -仟项目的领导者

微服务和vlm进入人工智能代理,实时分析城市的实时交通代摄像头。城市官员可以提问,并获得关于街道活动的快速、准确的见解,以及如何改善城市管理的操作建议,如调整交通灯定时。

全球领先的电子巨头富士康和和硕已经采用了物理人工智能、NIM微服务和Metropolis参考工作流程,以更高效地设计和运行其大规模的制造业务。

这些公司正在模拟建造虚拟工厂,以节省大量的时间和成本。他们也在进行更彻底的测试和改进数字孪生中的物理AI -包括AI多摄像头和视觉AI代理在实际部署之前,提高工作人员的安全性并提高操作效率。

用合成数据生成弥合模拟与现实的差距

许多人工智能驱动的企业现在正在采用“模拟优先”的方法来处理涉及现实世界工业自动化的生成物理人工智能项目。制造业、工厂物流和机器人公司需要管理复杂的人机交互、先进的设施和昂贵的设备。NVIDIA物理AI软件、工具和平台-包括物理AI和VLM N IM微服务、参考工作流和fVDB -可以帮助他们简化高度复杂的工程,以创建精确模拟现实世界条件的数字表示或虚拟环境。

vlm由于能够生成高度逼真的图像而在各行各业得到广泛采用。然而,由于创建精确的物理ai模型所需的大量数据,这些模型的训练可能具有挑战性。

使用计算机模拟仟从数字双胞胎生成的合成数据为现实世界的数据集提供了一个强大的替代方案,而现实世界的数据集可能很昂贵——而且有时不可能获得模型训练,这取决于用例。

NVIDIA NIM微服务和Omniverse Replicator等工具允许开发人员构建支持生成AI的合成数据管道,以加速创建健壮的、多样化的数据集,用于训练物理AI。这增强了适应性和

例如vlm等模型的性能,使它们能够更有效地跨行业和用例进行泛化。

可用性

开发人员可以访问最先进的、开放的、nvidia构建的基础架构模型和NIM微服务。Metropolis NIM参考worklow可以在GitHub存储库中获得,而Metropolis VIA微服务可以在开发者预览版中下载。

OpenUSD NIM微服务可以通过NVIDIA API目录预览。

在NVIDIA首席执行官黄仁勋在SIGGRAPH的炉边聊天中,观看加速计算和生成式人工智能如何改变行业,并为创新和增长创造新的机会。

软件产品信息请参见公告。

PHP Code Snippets Powered By : XYZScripts.com