Anthropic ha annunciato due nuovi modelli di intelligenza artificiale che, a suo dire, rappresentano un grande passo avanti verso il rendere gli agenti di intelligenza artificiale davvero utili.
Secondo l’azienda, gli agenti di intelligenza artificiale addestrati su Claude Opus 4, la versione più potente dell’azienda fino ad oggi, innalzano gli standard di ciò che questi sistemi sono in grado di fare, affrontando compiti difficili per lunghi periodi di tempo e rispondendo in modo più utile alle istruzioni degli utenti.
Claude Opus 4 è stato progettato per svolgere compiti complessi che comportano l’esecuzione di migliaia di passaggi nell’arco di diverse ore. Ad esempio, ha creato una guida per il videogioco Pokémon Rosso mentre giocava per più di 24 ore consecutive. Secondo Dianne Penn, responsabile del prodotto di ricerca presso Anthropic, il sistema più potente dell’azienda, il Claude 3.7 Sonnet, era in grado di giocare solo per 45 minuti.
Allo stesso modo, l’azienda afferma che uno dei suoi clienti, l’azienda tecnologica giapponese Rakuten, ha recentemente utilizzato Claude Opus 4 per codificare in modo autonomo per quasi sette ore in un complicato progetto open source.
Anthropic ha raggiunto questi progressi migliorando la capacità del modello di creare e mantenere “file di memoria” per memorizzare le informazioni chiave. Questa migliore capacità di “ricordare” rende la versione migliore per completare compiti più lunghi.
“Consideriamo questa nuova generazione di modelli come un salto di paradigma: da assistenti a veri agenti autonomi”, afferma Penn. “Mentre devi ancora fornire un sacco di feedback in tempo reale e prendere tutte le decisioni chiave per gli assistenti IA, un agente può prendere queste decisioni chiave da solo. Ciò consente agli esseri umani di funzionare maggiormente come manager o giudici, piuttosto che dover seguire questi sistemi in ogni fase”.
Anche se il Claude Opus 4 è limitato ai clienti a pagamento di Anthropoc, un secondo modello, il Claude Sonnet 4, sarà disponibile sia per gli utenti delle versioni a pagamento che di quelle gratuite. Opus 4 viene commercializzato come una versione potente e grande per sfide complesse, mentre Sonnet 4 è descritto come una piattaforma intelligente ed efficiente per l’uso quotidiano.
Entrambe le nuove piattaforme sono ibride, il che significa che possono offrire una risposta rapida o una risposta più approfondita e ponderata, a seconda della natura della richiesta. Durante il calcolo di una risposta, entrambi i sistemi possono effettuare ricerche online o utilizzare altri strumenti per migliorare l’output.
( fontes: MIT Technology Review)



