NVIDIA ha annunciato modelli di base eseguiti localmente su PC NVIDIA RTX™ AI che potenziano gli esseri umani digitali, la creazione di contenuti, la produttività e lo sviluppo.
Questi modelli, offerti come microservizi NVIDIA NIM, sono accelerati dalle nuove GPU GeForce RTX™ serie 50, che offrono fino a 3.352 trilioni di operazioni al secondo di prestazioni AI e 32 GB di VRAM. Basate sull’architettura NVIDIA Blackwell, le RTX serie 50 sono le prime GPU consumer ad aggiungere il supporto per il calcolo FP4, aumentando le prestazioni di inferenza AI di due volte e consentendo ai modelli AI generativi di essere eseguiti localmente in un ingombro di memoria inferiore, rispetto all’hardware di generazione precedente.
GeForce è da tempo una piattaforma essenziale per gli sviluppatori di IA. La prima rete di apprendimento profondo accelerata da GPU, AlexNet, è stata addestrata sulla GeForce GTX 580 nel 2012 e l’anno scorso, oltre il 30% dei documenti di ricerca pubblicati sull’IA ha citato l’uso della GeForce RTX.
Ora, con l’AI generativa e i PC AI RTX, chiunque può diventare uno sviluppatore. Una nuova ondata di strumenti low-code e no-code, come AnythingLLM, ComfyUI, Langflow e LM Studio, consente agli appassionati di utilizzare modelli AI in flussi di lavoro complessi tramite semplici interfacce utente grafiche.
I microservizi NIM connessi a queste GUI renderanno semplice l’accesso e l’implementazione degli ultimi modelli di IA generativa. NVIDIA AI Blueprints , basati sui microservizi NIM, forniscono flussi di lavoro di riferimento preconfigurati e facili da usare per gli esseri umani digitali, la creazione di contenuti e altro ancora.
Per soddisfare la crescente domanda da parte di sviluppatori e appassionati di intelligenza artificiale, tutti i principali produttori di PC e costruttori di sistemi stanno lanciando PC RTX AI compatibili con NIM con GPU GeForce RTX serie 50.
“L’intelligenza artificiale sta avanzando alla velocità della luce, dall’intelligenza artificiale percettiva all’intelligenza artificiale generativa e ora all’intelligenza artificiale agentica – ha affermato Jensen Huang, fondatore e ceo di NVIDIA – I microservizi NIM e gli AI Blueprints forniscono agli sviluppatori e agli appassionati di PC gli elementi costitutivi per esplorare la magia dell’intelligenza artificiale“.
I modelli NIMble
Foundation, reti neurali addestrate su enormi quantità di dati grezzi, sono gli elementi costitutivi dell’intelligenza artificiale generativa.
NVIDIA rilascerà una pipeline di microservizi NIM per PC RTX AI da parte di sviluppatori di modelli di punta come Black Forest Labs, Meta, Mistral e Stability AI. I casi d’uso spaziano tra modelli di linguaggio di grandi dimensioni (LLM), modelli di linguaggio di visione, generazione di immagini, parlato, modelli di incorporamento per generazione aumentata dal recupero (RAG), estrazione di PDF e visione artificiale.
“Le GPU GeForce RTX serie 50 con elaborazione FP4 sbloccheranno una vasta gamma di modelli che possono essere eseguiti su PC, che in precedenza erano limitati a grandi data center – ha affermato Robin Rombach, ceo di Black Forest Labs – Rendere FLUX un microservizio NVIDIA NIM aumenta la velocità con cui l’intelligenza artificiale può essere distribuita e sperimentata da più utenti, offrendo al contempo prestazioni incredibili”.
NVIDIA ha anche annunciato la famiglia di modelli aperti Llama Nemotron, che forniscono elevata accuratezza su un’ampia gamma di attività agentiche. Il modello Llama Nemotron Nano sarà offerto come microservizio NIM per PC e workstation RTX AI ed eccelle in attività di intelligenza artificiale agentiche come il follow-up delle istruzioni, la chiamata di funzioni, la chat, la codifica e la matematica.
I microservizi NIM includono i componenti chiave per l’esecuzione dell’intelligenza artificiale sui PC e sono ottimizzati per l’implementazione su GPU NVIDIA, sia su PC e workstation RTX che nel cloud.
“L’intelligenza artificiale sta guidando l’innovazione dei PC Windows 11 a un ritmo rapido e Windows Subsystem for Linux (WSL) offre un ottimo ambiente multipiattaforma per lo sviluppo dell’intelligenza artificiale su Windows 11 insieme a Windows Copilot Runtime – ha affermato Pavan Davuluri, vicepresidente aziendale di Windows presso Microsoft – I microservizi NVIDIA NIM, ottimizzati per PC Windows, offrono agli sviluppatori e agli appassionati modelli di intelligenza artificiale pronti per l’integrazione per le loro app Windows, accelerando ulteriormente l’implementazione delle funzionalità di intelligenza artificiale per gli utenti Windows“.
I microservizi NIM, in esecuzione su PC RTX AI, saranno compatibili con i principali framework di sviluppo AI e agenti, tra cui AI Toolkit for VSCode, AnythingLLM, ComfyUI, CrewAI, Flowise AI, LangChain, Langflow e LM Studio. Gli sviluppatori possono collegare applicazioni e flussi di lavoro basati su questi framework a modelli AI che eseguono microservizi NIM tramite endpoint standard del settore, consentendo loro di utilizzare la tecnologia più recente con un’interfaccia unificata su cloud, data center, workstation e PC.
Dare un volto all’intelligenza artificiale agentica
Per dimostrare come appassionati e sviluppatori possono usare NIM per creare agenti e assistenti di intelligenza artificiale, NVIDIA ha presentato in anteprima Project R2X, un avatar per PC con funzionalità visive in grado di mettere le informazioni a portata di mano dell’utente, fornire assistenza con app desktop e videoconferenze, leggere e riassumere documenti e altro ancora.
L’avatar viene renderizzato utilizzando NVIDIA RTX Neural Faces , un nuovo algoritmo di intelligenza artificiale generativa che aumenta la rasterizzazione tradizionale con pixel interamente generati. Il volto viene quindi animato da un nuovo modello NVIDIA Audio2Face-3D basato sulla diffusione che migliora il movimento delle labbra e della lingua. R2X può essere collegato a servizi di intelligenza artificiale cloud come GPT4o di OpenAI e Grok di xAI, e microservizi NIM e AI Blueprints, come PDF retriever o LLM alternativi, tramite framework per sviluppatori come CrewAI, Flowise AI e Langflow.
AI Blueprints in arrivo su PC
I microservizi NIM sono disponibili anche per gli utenti PC tramite AI Blueprints, flussi di lavoro AI di riferimento che possono essere eseguiti localmente su PC RTX. Con questi blueprint, gli sviluppatori possono creare podcast da documenti PDF, generare immagini straordinarie guidate da scene 3D e altro ancora.
Il blueprint per PDF in podcast estrae testo, immagini e tabelle da un PDF per creare uno script di podcast che può essere modificato dagli utenti. Può anche generare una registrazione audio completa dallo script utilizzando le voci disponibili nel blueprint o in base al campione vocale di un utente. Inoltre, gli utenti possono avere una conversazione in tempo reale con l’host del podcast AI per saperne di più su argomenti specifici.
Il progetto utilizza microservizi NIM come Mistral-Nemo-12B-Instruct per il linguaggio, NVIDIA Riva per la conversione di testo in voce e il riconoscimento vocale automatico e la raccolta di microservizi NeMo Retriever per l’estrazione di PDF.
Il progetto AI per l’AI generativa guidata in 3D offre agli artisti un controllo più preciso sulla generazione di immagini. Mentre l’AI può generare immagini straordinarie da semplici prompt di testo, controllare la composizione delle immagini usando solo parole può essere impegnativo. Con questo progetto, i creatori possono usare semplici oggetti 3D disposti in un renderer 3D come Blender per guidare la generazione di immagini AI. L’artista può creare risorse 3D a mano o generarle usando l’AI, posizionarle nella scena e impostare la telecamera viewport 3D. Quindi, un flusso di lavoro preconfezionato alimentato dal microservizio FLUX NIM utilizzerà la composizione corrente per generare immagini di alta qualità che corrispondono alla scena 3D.