AI走向實體:新的NVIDIA NIM微服務將生成式AI帶入數字環境

生成物理AI NIM微服務和NVIDIA Metropolis參考工作流程正在幫助創建智能的沈浸式工作環境。

數百萬人已經在使用生成式人工智能來輔助寫作和學習。現在,這項技術還可以幫助他們更有效地仟駕馭現實世界。

NVIDIA在SIGGRAPH上宣布了生成物理人工智能的最新進展,包括用於構建交互式可視化人工智能代理的NVIDIA Metropolis參考工作流程和新的NVIDIA NIM微服務,這些微服務將幫助開發人員訓練物理

機器和改進它們處理復雜任務的方式。

其中包括支持NVIDIA新深度的三個fVDB NIM微服務、3D世界的學習框架,以及USD代碼,USD搜索和USD驗證NIM微服務與通用場景描述(OpenUSD)的工作。

NVIDIA OpenUSD NIM微服務與世界上第壹個OpenUSD開發的生成式人工智能模型——也由NVIDIA開發——使開發人員能夠將生成式人工智能副駕駛和代理集成到USD中工作和拓寬3D世界的可能性。

NVIDIA NIM微服務改變物理AI景觀物理人工智能使用先進的模擬和學習方法來幫助機器人和其他工業自動化更仟有效地感知、推理和導航它們環境。這項技術正在改變制造業和零售業等行業醫療保健,以及利用機器人、工廠和倉庫推進智能空間技術、外科人工智能代理以及能夠更自主、更精確地操作的汽車。

NVIDIA o仟提供針對特定模型和行業領域定制的廣泛NIM微服務。NVIDIA為物理AI支持量身定制的NIM套件語音和翻譯,視覺和智能,逼真的動畫和行為的能力。

使用NVIDIA NIM將視覺AI代理變成夢想家

視覺人工智能代理使用計算機視覺能力來感知物理世界並與之交互,並執行推理任務。

高度感知和互動的視覺人工智能代理是由壹類新的生成式人工智能模型稱為視覺語言模型(VLMs),它是數字化的橋梁物理人工智能工作負載中的感知和現實世界交互,以增強決策、準確性、交互性和性能。通過vlm,開發人員可以構建視覺AI代理,即使在復雜的環境中,也可以更有效地處理具有挑戰性的任務。

基於生成式人工智能的視覺人工智能代理正迅速部署在醫院、工廠、倉庫、零售商店、機場、交通樞紐等場所。為了幫助物理AI開發人員更輕松地構建高性能、自定義可視化AI代理,NVIDIA o仟為物理AI提供了NIM微服務和參考工作流程。NVIDIA Metropolis參考工作流程為定制、構建和部署可視化AI代理提供了壹種簡單、結構化的方法,詳見博客。

(Build VLM-Powered Visual AI Agents Using NVIDIA NIM and NVIDIA VIA Microservices | NVIDIA Technical Blog)

NVIDIA NIM幫助K2K使巴勒莫更E代客戶,安全,可靠

意大利巴勒莫(Palermo)的城市交通代經理部署了使用NVIDIA NIM的視覺人工智能代理,以發現物理洞察,幫助他們更好地管理道路。

​K2K是NVIDIA Metropolis的合作夥伴,是整合NVIDIA NIM的e -仟項目的領導者

微服務和vlm進入人工智能代理,實時分析城市的實時交通代攝像頭。城市官員可以提問,並獲得關於街道活動的快速、準確的見解,以及如何改善城市管理的操作建議,如調整交通燈定時。

全球領先的電子巨頭富士康和和碩已經采用了物理人工智能、NIM微服務和Metropolis參考工作流程,以更高效地設計和運行其大規模的制造業務。

這些公司正在模擬建造虛擬工廠,以節省大量的時間和成本。他們也在進行更徹底的測試和改進數字孿生中的物理AI -包括AI多攝像頭和視覺AI代理在實際部署之前,提高工作人員的安全性並提高操作效率。

用合成數據生成彌合模擬與現實的差距

許多人工智能驅動的企業現在正在采用“模擬優先”的方法來處理涉及現實世界工業自動化的生成物理人工智能項目。制造業、工廠物流和機器人公司需要管理復雜的人機交互、先進的設施和昂貴的設備。NVIDIA物理AI軟件、工具和平臺-包括物理AI和VLM N IM微服務、參考工作流和fVDB -可以幫助他們簡化高度復雜的工程,以創建精確模擬現實世界條件的數字表示或虛擬環境。

vlm由於能夠生成高度逼真的圖像而在各行各業得到廣泛采用。然而,由於創建精確的物理ai模型所需的大量數據,這些模型的訓練可能具有挑戰性。

使用計算機模擬仟從數字雙胞胎生成的合成數據為現實世界的數據集提供了壹個強大的替代方案,而現實世界的數據集可能很昂貴——而且有時不可能獲得模型訓練,這取決於用例。

NVIDIA NIM微服務和Omniverse Replicator等工具允許開發人員構建支持生成AI的合成數據管道,以加速創建健壯的、多樣化的數據集,用於訓練物理AI。這增強了適應性和

例如vlm等模型的性能,使它們能夠更有效地跨行業和用例進行泛化。

可用性

開發人員可以訪問最先進的、開放的、nvidia構建的基礎架構模型和NIM微服務。Metropolis NIM參考worklow可以在GitHub存儲庫中獲得,而Metropolis VIA微服務可以在開發者預覽版中下載。

OpenUSD NIM微服務可以通過NVIDIA API目錄預覽。

在NVIDIA首席執行官黃仁勛在SIGGRAPH的爐邊聊天中,觀看加速計算和生成式人工智能如何改變行業,並為創新和增長創造新的機會。

軟件產品信息請參見公告。

PHP Code Snippets Powered By : XYZScripts.com