Nella giornata di ieri, Amazon ha svelato Nova Act, un nuovo agente basato sull’intelligenza artificiale generica, in grado di prendere il controllo di un browser web e eseguire autonomamente alcune azioni semplici. A supporto di questo lancio, Amazon ha anche introdotto il Nova Act SDK, un toolkit che consente agli sviluppatori di progettare prototipi di agenti sfruttando Nova Act, come riporta techcrunch.com.
Nova Act è stato sviluppato dal laboratorio AGI di Amazon, situato a San Francisco, recentemente inaugurato. Questo agente AI contribuirà anche alle funzionalità avanzate del prossimo aggiornamento di Alexa+, una versione migliorata dell’assistente vocale Amazon, potenziata con intelligenza artificiale generativa. La versione attuale di Nova Act, tuttavia, è ancora in fase di anteprima e non completamente rifinita.
Gli sviluppatori possono ora accedere al Nova Act SDK attraverso un nuovo sito web, nova.amazon.com, che funge anche da vetrina per i modelli di base di Nova. L’obiettivo di Amazon con Nova Act è quello di competere con tecnologie simili come Operator di OpenAI e Computer Use di Anthropic, puntando a creare agenti AI in grado di interagire autonomamente con il web, rendendo i chatbot tradizionali molto più utili.
Sebbene Amazon non sia la prima a lanciare questo tipo di tecnologia agentica, grazie all’integrazione con Alexa+, la sua portata potrebbe essere significativamente più ampia rispetto ai concorrenti. Con il Nova Act SDK, gli sviluppatori potranno automatizzare azioni di base come ordinare pasti online o prenotare ristoranti, facendo interagire gli agenti AI con pagine web, compilando moduli o selezionando date nei calendari.
Secondo Amazon, Nova Act ha superato gli agenti di OpenAI e Anthropic in diversi test interni. Per esempio, in uno dei test aziendali, ScreenSpot Web Text, che valuta come un agente AI interagisce con il testo su uno schermo, Nova Act ha ottenuto un punteggio del 94%, risultando superiore a CUA di OpenAI (88%) e Claude 3.7 Sonnet di Anthropic (90%). Tuttavia, Amazon non ha ancora effettuato test utilizzando gli strumenti più comuni, come WebVoyager.
Nova Act rappresenta il primo prodotto pubblico sviluppato dal laboratorio AGI di Amazon, una nuova iniziativa guidata da David Luan e Pieter Abbeel, ex ricercatori di OpenAI che sono stati assunti da Amazon l’anno scorso. Sebbene inizialmente sembri curioso che un laboratorio AGI stia sviluppando agenti AI per compiti semplici come ordinare cibo, Luan ha dichiarato a TechCrunch che gli agenti rappresentano un passo fondamentale verso lo sviluppo di sistemi AI superintelligenti, in grado di eseguire qualsiasi compito umano su un computer.
Luan ha anche precisato che il Nova Act SDK è progettato per automatizzare attività brevi e semplici, dando agli sviluppatori la possibilità di definire chiaramente quando è necessario un intervento umano durante l’utilizzo dell’agente. L’obiettivo è permettere agli sviluppatori di creare applicazioni agentiche più affidabili, sebbene non completamente autonome.
Anche se Amazon sta entrando in un mercato affollato con il suo primo agente AI generico, la tecnologia è cruciale per l’azienda, che punta molto su di essa. I primi test di Nova Act potrebbero rappresentare un’anteprima delle capacità avanzate di Alexa+, un prodotto che Amazon sta preparando da tempo. Il vero test per Amazon sarà vedere se il suo agente AI risolverà i problemi di affidabilità che hanno afflitto i primi modelli di OpenAI, Google e Anthropic, che spesso mostrano lentezza, difficoltà a operare autonomamente e commettono errori che un essere umano non farebbe. Nei prossimi mesi vedremo se Amazon riuscirà a superare questi limiti o se i suoi agenti soffriranno degli stessi difetti dei concorrenti.