Anthropic presenta Claude Opus 4.8: l’intelligenza artificiale che impara a dire “non lo so”

Il mercato dei modelli linguistici compie un passo in avanti non tanto sul fronte della pura potenza calcolatrice, quanto su quello, ben più cruciale, dell’affidabilità e della trasparenza. Anthropic ha annunciato il debutto di Claude Opus 4.8, una versione profondamente rivista del suo modello di punta che mette al centro del progetto una caratteristica finora merce rara nel mondo degli assistenti digitali: l’onestà intellettuale.
Da sempre, uno dei limiti più complessi da superare per i sistemi basati sull’intelligenza artificiale generativa è la tendenza a giungere a conclusioni affrettate. Molto spesso i modelli presentano risposte parziali o palesemente errate con un tono estremamente sicuro e assertivo, un fenomeno noto in gergo tecnico come “allucinazione”.
Consapevole di questo limite strutturale, Anthropic ha addestrato Claude Opus 4.8 per evitare formulazioni non supportate da prove concrete. Il nuovo algoritmo è ora in grado di riconoscere i propri margini di incertezza e di segnalarli esplicitamente all’utente. Questa maggiore accuratezza si riflette in modo sensibile nella scrittura del codice di programmazione, un ambito in cui il nuovo modello si dimostra quattro volte meno incline rispetto al suo predecessore a far passare inosservati bug o difetti logici.
Accanto a una maggiore precisione scientifica, l’aggiornamento introduce una gestione inedita e flessibile delle risorse computazionali. Gli utenti hanno ora la possibilità di calibrare l’intensità del lavoro richiesto a Claude a seconda della complessità del compito. Scegliere risposte che richiedono uno sforzo maggiore comporterà un consumo superiore di token, ma per compiti più semplici sarà possibile optare per un livello di elaborazione più basso, evitando così di esaurire rapidamente i limiti di utilizzo della piattaforma.
La novità tecnologica più rilevante è però rappresentata dal debutto in anteprima di ricerca dei cosiddetti flussi di lavoro dinamici. Questa funzione permette a Claude Opus 4.8 di pianificare un progetto complesso in totale autonomia e di suddividerlo tra centinaia di sotto-agenti capaci di operare in parallelo all’interno della stessa sessione lavorativa. Grazie alla maggiore stabilità del modello, questi agenti possono rimanere attivi per sessioni prolungate, verificando autonomamente i risultati parziali prima di presentare il resoconto finale all’utente.
Si tratta di un’architettura che promette di trasformare il chatbot da semplice assistente testuale a vero e proprio coordinatore di flussi operativi aziendali.


3 commenti
Ma non mi permette di aggiornare senza passare a un piano PRO: come mai a te sembra essere stato implementato con il piano gratuito?
Anche a me quando tento di aggiornare mi rimanda alla pagina dei piani a pagamento. Claude Opus 4.8 è disponibile su Claude per i piani Pro, Max, Team ed Enterprise — non è incluso nel piano gratuito.
Comunque il “non lo so” era presente anche sui modelli precedenti più recenti e comunque la promessa delle sessioni prolungate non tiene conto del problema della compattazione che crea errori di diverso tipo. Ho scritto un articolo a riguardo, qualora interessasse.