Anthropic ha annunciato il debutto di Claude Opus 4 e Claude Sonnet 4, due nuovi modelli di intelligenza artificiale che segnano un netto passo avanti nelle capacità di programmazione, ragionamento e gestione degli agenti autonomi.
L’obiettivo è superare i principali competitor del settore AI, grazie a strumenti pensati sia per l’uso professionale che per quello aziendale.
Il modello Claude Opus 4 è il più potente mai realizzato dalla compagnia e viene già definito “il miglior modello di coding al mondo”, con performance superiori del 72,5% su SWE-bench e del 43,2% su Terminal-bench, due benchmark riconosciuti per la valutazione delle capacità di programmazione delle AI.
Opus 4 è progettato per affrontare task lunghi e complessi, come quelli che richiedono ore di calcolo o migliaia di passaggi. È progettato per sostenere flussi di lavoro agentici, ovvero in cui l’AI agisce come un assistente autonomo in grado di portare avanti progetti complessi senza un intervento umano costante.
Insieme a Opus 4, debutta Claude Sonnet 4, un aggiornamento significativo rispetto alla versione 3.7. Il nuovo modello offre risposte più precise, una programmazione e un ragionamento migliorati, pur mantenendo un bilanciamento ottimale tra efficienza e prestazioni. Non raggiunge le vette di Opus 4, ma punta a offrire un mix pratico di potenza e leggerezza, ideale per un utilizzo quotidiano o per dispositivi con risorse limitate.
Entrambi i modelli includono nuove funzionalità in versione beta, pensate per rafforzare il “pensiero esteso”, ovvero la capacità dell’AI di alternare ragionamento autonomo e utilizzo di strumenti come la ricerca web o l’analisi di file locali. I tool possono ora essere usati in parallelo e i modelli sono in grado di memorizzare fatti chiave per garantire continuità tra una sessione e l’altra e costruire conoscenza progressiva.
Anthropic ha anche ridotto i comportamenti opportunistici delle AI, ovvero quei casi in cui i modelli cercavano di evitare di svolgere i compiti in modo adeguato. Sono state anche introdotte nuove sintesi del ragionamento per rendere più leggibili i processi logici complessi.
Claude Code, lo strumento per la programmazione agentica in terminale, è ora disponibile per tutti. Claude Code consente di eseguire compiti in background grazie al supporto di GitHub Actions e offre integrazioni native con i principali ambienti di sviluppo, come VS Code e JetBrains. L’AI può modificare file, correggere bug, rispondere a domande sul codice e assistere gli sviluppatori in tempo reale.
I modelli Opus 4 e Sonnet 4 sono già accessibili agli abbonati dei piani Pro, Max, Team ed Enterprise su Claude, mentre Sonnet 4 è disponibile anche per gli utenti gratuiti. Per gli sviluppatori, i modelli sono integrati su Anthropic API, Amazon Bedrock e Google Cloud Vertex AI.
Leggi o Aggiungi Commenti