擴展AI代理界麵選項與2D和3D數字人類化身

當與生成式人工智能應用程序交互時,用戶有多種交流選擇——文本、語音或通過數字化身。

傳統的聊天機器人或副駕駛應用程序都有文本界麵,用戶可以在其中輸入查詢並接收基於文本的響應。對於免提通信,自動語音識別(ASR)和文本轉語音(TTS)等語音人工智能技術促進了口頭交互,非常適合基於電話的客戶服務等場景。此外,將數字化身與語音功能相結合,爲用戶提供了一個更動態的界麵,使用戶可以直觀地參與到應用程序中。根據Gartner的數據,到2028年,員工人數超過500人的組織中,有45%將利用員工人工智能化身來擴大人力資本的容量

數字化身在風格上可以有很大的不同——一些用例受益於逼真的3D或2D化身,而另一些用例則更適合風格化或卡通化的化身。

3D化身提供完全身臨其境的體驗,展示逼真的動作和照片真實感。開髮這些化身需要專門的軟件和技術專長,因爲它們涉及複雜的身體動畫和高質量的渲染。

2D頭像的開髮速度更快,是網絡嵌入式解決方案的理想選擇。它們提供了一種創造交互式AI的簡化方法,通常需要美術人員進行設計和動畫,但在技術資源方麵不那麼密集。

爲了啟動您創建一個逼真的數字人,NVIDIA AI藍圖客戶服務的數字人可以爲各種用例量身定製。該功能現在包含在對NVIDIA Maxine Audio2Face-2D NIM微服務的支持中。此外,藍圖現在爲3D角色開髮者提供了使用虛幻引擎渲染的靈活性。

如何在您的代理應用程序中添加一個會説話的數字頭像

在數字人類的AI藍圖中,用戶與利用NVIDIA ACE技術的AI代理進行交互(圖1)。

説明數字人類AI藍圖架構的圖表,其中用戶與連接到RAG管道的NVIDIA ACE代理交互以生成響應。

圖1所示。數字人類的NVIDIA AI藍圖架構圖

來自用戶的音頻輸入被髮送到ACE代理,ACE代理協調各種NIM微服務之間的通信。ACE代理使用Riva Parakeet NIM將音頻轉換爲文本,然後由RAG管道進行處理。RAG管道使用NVIDIA NeMo檢索器嵌入和重新排序NIM微服務,以及LLM NIM,從存儲的文檔中響應相關上下文。

最後,通過Riva TTS將響應轉換回語音,使用Audio2Face-3D NIM或Audio2Face-2D NIM爲數字人動畫。

設計AI代理應用程序時的注意事項

在全球化企業中,跨語言的溝通障礙會減慢運營速度。具有多語言功能的人工智能頭像可以輕鬆地跨語言交流。數字人類AI藍圖提供會話AI功能,通過Riva ASR,神經機器翻譯(NMT)以及智能中斷和駁船支持,模擬適應用戶語音風格和語言的人類交互。

數字人工智能代理的主要好處之一是它們能夠爲員工和客戶提供“永遠在線”的資源。基於rag的人工智能代理不斷從交互中學習並隨着時間的推移而改進,從而提供更準確的響應和更好的用戶體驗。

對於考慮數字人機界麵的企業,選擇正確的化身和呈現選項取決於用例和自定義首選項。

用例:3D化身是高度沉浸式用例的理想選擇,比如在實體店、信息亭或主要的一對一互動中,而2D化身則適用於網絡或移動會話AI用例。

開髮和定製偏好:擁有3D和動畫專業知識的團隊可以利用他們的技能來創建身臨其境和超逼真的化身,而希望快速迭代和定製的團隊可以從2D化身的簡單性中受益。

比例考慮:在評估角色和相應的渲染選項時,比例是一個重要的考慮因素。流吞吐量,特別是3D角色,高度依賴於所使用的角色資産的選擇和質量,所需的輸出分辨率和渲染選項的選擇(Omniverse Renderer或虛幻引擎)可以在決定每個流計算足跡方麵髮揮關鍵作用。

NVIDIA Audio2Face-2D允許從肖像圖像和語音輸入創建逼真的2D化身。簡單的配置允許開髮人員快速迭代並爲他們的數字人類用例生成目標化身和動畫。通過實時輸出和雲原生部署,2D數字人是交互式用例和交互式網絡嵌入式解決方案的流媒體化身的理想選擇。

例如,企業希望在多個設備上部署人工智能代理,並將數字人類插入到網絡或移動優先的客戶旅程中,可以從2D化身減少的硬件需求中受益。

3D逼真的虛擬化身爲需要高度同理心的用戶參與的用例提供了無與倫比的沉浸式體驗。NVIDIA Audio2Face-3D和Animation NIM微服務通過生成混合形狀以及微妙的頭部和身體動畫來動畫3D角色,以創建身臨其境,逼真的化身。數字人類AI藍圖現在支持兩種3D角色渲染選項,包括Omniverse Renderer和虛幻引擎Renderer,爲開髮人員提供了集成他們選擇的渲染選項的靈活性。

要探索數字人類如何增強您的企業,請訪問NVIDIA API目錄,了解不同的化身選項。

開始使用數字頭像

要使用Audio2Face-2D和虛幻引擎NIM微服務進行實際開髮,請申請ACE搶先體驗或潛入數字人類AI藍圖技術博客,了解如何添加數字人類界麵來個性化聊天機器人應用程序。

GARTNER是GARTNER, Inc.和/或其附屬公司在美國和國際上的注冊商標和服務標誌,在獲得許可的情況下使用。版權所有。

PHP Code Snippets Powered By : XYZScripts.com