Chiudi il Menu
iSpazioiSpazio
  • Notizie
  • Offerte iSpazio
  • Sfondi
  • Downloads
  • Recensioni
  • iOS 26
  • Sconti Amazon
Menu Espanso
  • Home
  • Forum
  • Notizie
  • Offerte iSpazio
  • iOS 26
  • iPhone 16
  • Downloads
  • Guide
  • Sconti Amazon
  • Contatti
  • Pubblicità
Facebook X (Twitter) Instagram YouTube TikTok
iSpazioiSpazio
  •  Forum
  • Offerte iSpazio
  • Wallpapers Central
  • Teslers
Scarica l'App
  • Offerte
  • Sfondi
  • Guide
    • Personalizzazione
    • Video Guide TikTok
  • Recensioni
  • Downloads
    • Sfondi
    • Suonerie
    • Comandi Rapidi
    • Sfondi Personalizzati
    • Widget e Altro
    • iOS
    • iTunes
  • Dispositivi Apple
    1. iPhone
    2. iPad
    3. Mac
    4. Apple Watch
    5. iOS 26
    6. Vedi tutto

    Apple estende il programma di riparazione fai-da-te agli iPhone 17 e iPhone Air

    31 Ott 2025

    Tim Cook conferma: la domanda di iPhone 17 è superiore alle attese di Apple

    31 Ott 2025

    iPhone 17 e iPhone Air ottengono lo stesso punteggio nei test del display di DXOMARK

    29 Ott 2025

    Test reali e di laboratorio confermano che la batteria dell’iPhone Air dura un’intera giornata

    28 Ott 2025

    Teardown iPad Pro M5: iFixit scopre lo spazio per una seconda fotocamera frontale

    1 Nov 2025

    Il prossimo iPad mini potrebbe essere resistente all’acqua come l’iPhone

    29 Ott 2025

    Apple prepara quattro nuove app “pro” per iPad, tra cui Pixelmator Pro e Motion

    28 Ott 2025

    iPad Pro M6, in arrivo un nuovo sistema di raffreddamento a camera di vapore

    26 Ott 2025

    iFixit smonta il MacBook Pro M5: miglioramenti minimi ma passo avanti per le riparazioni

    26 Ott 2025

    I nuovi MacBook Pro M5 sono disponibili all’acquisto su Amazon e si possono pagare in 5 rate!

    20 Ott 2025

    MacBook Air M5 atteso nella primavera 2026, in arrivo anche nuovi Mac Studio e Mac mini

    17 Ott 2025

    MacBook Pro, Apple lavora a un grande restyling con display OLED e touch integrato

    17 Ott 2025

    Come utilizzare le notifiche di ipertensione su Apple Watch in watchOS 26

    22 Ott 2025

    watchOS 26 attiva automaticamente il Risparmio energetico quando togliamo l’Apple Watch

    9 Ott 2025

    Con watchOS 26, il quadrante dell’Apple Watch diventa più intelligente grazie ai “suggerimenti”

    9 Ott 2025

    La prossima Apple Watch Activity Challenge si terrà il 10 ottobre

    8 Ott 2025

    Teardown iPad Pro M5: iFixit scopre lo spazio per una seconda fotocamera frontale

    1 Nov 2025

    iPhone 18 Pro potrebbe arrivare in tre nuovi colori inediti

    1 Nov 2025

    Affinity diventa gratuita e si integra con Canva: nasce la “super-app” per designer e fotografi

    31 Ott 2025

    OpenAI prepara la quotazione in Borsa dopo l’addio al modello no-profit

    31 Ott 2025

    Teardown iPad Pro M5: iFixit scopre lo spazio per una seconda fotocamera frontale

    1 Nov 2025

    iPhone 18 Pro potrebbe arrivare in tre nuovi colori inediti

    1 Nov 2025

    Affinity diventa gratuita e si integra con Canva: nasce la “super-app” per designer e fotografi

    31 Ott 2025

    OpenAI prepara la quotazione in Borsa dopo l’addio al modello no-profit

    31 Ott 2025
  • iPhone 17
  • iOS 26
  • Sconti Amazon
Contatti
Pubblicità
iSpazioiSpazio
  • Notizie
  • Offerte iSpazio
  • Sfondi
  • Downloads
  • Recensioni
  • iOS 26
  • Sconti Amazon
AI

Nuova ricerca mette in discussione lo studio Apple sui limiti del ragionamento delle AI

Una nuova pubblicazione smonta la tesi dello studio Apple sui crolli nel ragionamento delle AI, puntando il dito su errori metodologici e valutazioni scorrette.
Francesco SantagatiDi Francesco Santagati16 Giu 2025Commenta4 min di lettura
Condividi Facebook Twitter Telegram WhatsApp Copia Link Threads Email
Share
Facebook Twitter WhatsApp Telegram Threads Email Copia Link
In qualità di Affiliato Amazon, iSpazio riceve una commissione dagli acquisti idonei senza alcun costo per voi. (info).
Icona Cerchi Prodotti Apple ed accessori Tech in sconto?

Cerchi Prodotti Apple ed accessori Tech in sconto?

Segui il nostro canale @scontiamolo su Telegram!

La recente pubblicazione di Apple dal titolo “The Illusion of Thinking” ha sollevato un dibattito acceso nella comunità AI. Lo studio, che sostiene la tesi di un vero e proprio collasso dei Large Reasoning Models nei compiti complessi, ha fatto molto discutere per le sue conclusioni nette. Tuttavia, non tutti sono d’accordo con la prospettiva presentata dalla società di Cupertino.

Advertising

Nelle ultime ore, Alex Lawsen, ricercatore per Open Philanthropy, ha pubblicato una dettagliata contro-analisi che smonta alcuni degli aspetti più controversi dello studio Apple. Il suo paper, intitolato “The Illusion of the Illusion of Thinking” e co-firmato anche dal modello Claude Opus di Anthropic, mette in dubbio i risultati ottenuti da Apple e sposta il dibattito su un piano più tecnico. Secondo Lawsen, molte delle evidenze più eclatanti pubblicate da Apple sarebbero in realtà il risultato di errori nella progettazione degli esperimenti e non di veri limiti nel ragionamento delle AI.

La critica non nega che i modelli AI odierni incontrino difficoltà sui puzzle di pianificazione più complessi. Il punto centrale riguarda la confusione tra limiti pratici nell’output e vere e proprie carenze nella capacità di ragionamento. Lawsen sostiene che Apple abbia attribuito ai modelli un fallimento totale dove in realtà c’erano solo vincoli tecnici e scelte metodologiche discutibili.

Tra le principali osservazioni di Lawsen emerge la questione del limite dei token. Nei test con la Torre di Hanoi da otto dischi in su, il collasso segnalato da Apple sarebbe stato causato proprio dal superamento del numero massimo di token che i modelli potevano generare in output. In alcuni casi, i modelli stessi avevano segnalato chiaramente di voler interrompere la soluzione per motivi di budget di token, scrivendo messaggi come “Il pattern continua, ma mi fermo qui per risparmiare token”.

Un altro punto critico riguarda la presenza, nel test del River Crossing, di puzzle impossibili da risolvere. Alcune istanze includevano combinazioni che nessun algoritmo avrebbe potuto portare a termine, come il trasporto di più di sei attori su una barca con capienza insufficiente. I modelli AI sono stati comunque penalizzati per aver riconosciuto l’impossibilità della soluzione.

C’è poi il nodo della valutazione automatizzata dei risultati. Apple ha utilizzato pipeline di scoring che prendevano in considerazione soltanto le liste di mosse complete ed enumerate, senza distinguere tra soluzioni parziali dovute a limiti di output e reali errori di ragionamento. In questo modo, ogni output troncato veniva classificato come un fallimento totale, anche quando il modello aveva già dimostrato di saper pianificare la strategia corretta.

Per supportare la sua tesi, Lawsen ha ripetuto una parte dei test della Torre di Hanoi chiedendo ai modelli di scrivere una funzione ricorsiva in Lua che generasse la soluzione, anziché elencare manualmente tutte le mosse. Il risultato è stato netto. Modelli come Claude, Gemini e OpenAI o3 hanno prodotto senza difficoltà algoritmi corretti anche per problemi da quindici dischi, ben oltre la soglia in cui Apple aveva rilevato un successo pari a zero.

Secondo Lawsen, eliminando i vincoli artificiali sull’output, i modelli di ragionamento sarebbero pienamente in grado di affrontare anche compiti ad altissima complessità, almeno sotto il profilo della generazione dell’algoritmo.

Il dibattito, tuttavia, va ben oltre una semplice diatriba accademica. Lo studio Apple è stato già citato come prova del fatto che gli LLM attuali sarebbero incapaci di ragionare in modo scalabile, ma la nuova replica invita a leggere i dati con maggiore attenzione. La verità, suggerisce Lawsen, sarebbe più sfumata. Le AI faticano con output di lunghissima enumerazione sotto i limiti attuali delle piattaforme, ma i motori di ragionamento non sarebbero così fragili come descritto inizialmente.

Il ricercatore non assolve comunque i modelli da ogni responsabilità. Anche Lawsen riconosce che la generalizzazione algoritmica pura resta una sfida ancora aperta, e i suoi stessi esperimenti sono da considerarsi solo un primo passo. Nel finale del suo lavoro, Lawsen suggerisce ai futuri studi di adottare nuovi standard di valutazione, come la verifica della solvibilità dei puzzle prima della somministrazione ai modelli, la distinzione tra limiti di output e reale ragionamento, la scelta di metriche che riflettano la difficoltà computazionale più che la lunghezza della soluzione, e la considerazione di più rappresentazioni per distinguere la comprensione algoritmica dall’esecuzione puntuale.

Secondo Lawsen, la vera domanda non riguarda più la capacità degli LLM di ragionare, ma l’adeguatezza dei criteri con cui questa capacità viene giudicata. Prima di dichiarare il fallimento del ragionamento, sarebbe meglio interrogarsi sulle regole con cui si decide che il ragionamento è realmente venuto meno.

Sai che siamo anche su Telegram? Unisciti al nostro canale iSpazio per ricevere le notifiche oppure Apple Italia per chattare con altri utenti. Scopri i migliori prodotti Tech in sconto su Amazon con il nostro canale OFFERTE iSpazio.
Icona dell'applicazione Le Migliori Offerte Amazon disponibile su App Store

Le Migliori Offerte Amazon

Selezionate dalla redazione di iSpazio
GUARDALE LIVE  
  • Filtra:
  • Tutte
  • Minimo Storico
  • Elettronica
  • Salute e cura della persona
33%  
Dash Pods Detersivo In Capsule, 132 Lavaggi, Classico, Rimuove Le Macchie, Igienizza, Brillantezza Per I Capi
00:05
Dash Pods Detersivo In Capsule, 132 Lavaggi, Classico, Rimuove Le Macchie, Igienizza, Brillantezza Per I Capi54,98€36,99€

Scarica la nostra app e leggi le notizie in mobilità. Porta iSpazio sempre con te, anche su Telegram.
| Applicazione iOS
Con l'applicazione ufficiale di iSpazio resterai sempre aggiornato sulle notizie Apple, video tutorial per iPhone e tanto altro. riceverai una notifica per ogni nuovo articolo. Puoi utilizzare anche i Widget per tenere le novità sott'occhio nella Home o nella Lockscreen.
Scaricala subito!
| Canale Telegram 10.700+ Utenti
Su Telegram invece, segnaliamo soltanto le notizie più importanti ed urgenti oppure i nostri nuovi video su YouTube. E' un canale molto interessante, assolutamente non invasivo perchè non inviamo troppe push, e vi consigliamo di seguirci anche lì.
Unisciti a noi!
ispazio notifiche
AI algoritmo Anthropic Apple Claude Opus critiche Apple intelligenza artificiale llm metodologie di test Open Philanthropy output token puzzle reasoning ricerca Tower of Hanoi valutazione AI
Seguici su Google News
Condividi Facebook Twitter Telegram WhatsApp Threads Email Copia Link
Articolo precedenteApple conferma problemi di alimentazione su alcuni Mac mini 2023, parte il programma di assistenza
Articolo successivo AirPods Pro 3, il lancio slitta al 2026 secondo un nuovo report degli analisti

Articoli correlati

Teardown iPad Pro M5: iFixit scopre lo spazio per una seconda fotocamera frontale

1 Nov 2025Commenta

iPhone 18 Pro potrebbe arrivare in tre nuovi colori inediti

1 Nov 2025Commenta

Affinity diventa gratuita e si integra con Canva: nasce la “super-app” per designer e fotografi

31 Ott 2025Commenta

OpenAI prepara la quotazione in Borsa dopo l’addio al modello no-profit

31 Ott 2025Commenta

Leggi o Aggiungi Commenti

Advertising

Da non perdere!

Apple rilascia iOS 26.1 RC: arrivano le opzioni Liquid Glass, il blocco dello swipe fotocamera e tante novità grafiche

28 Ott 2025

iOS 26.1 beta 4: Tutte le novità raccolte in un solo articolo in continuo aggiornamento! [4]

21 Ott 2025

OpenAI lancia ChatGPT Atlas, il browser con AI che regala anche 1 mese di ChatGPT Plus a tutti!

21 Ott 2025

Apple presenta il nuovo iPad Pro con chip M5: potenza estrema, AI evoluta e display Ultra Retina XDR

15 Ott 2025
Advertising

Gli articoli più letti

GM insiste: “CarPlay non serve più” e, citando Steve Jobs, decide di rimuoverlo anche dalle auto a benzina

iPhone 18 Pro e iPhone 17e, svelati i design dei nuovi modelli 2026

Info su iSpazio
Info su iSpazio

iSpazio è il punto di riferimento italiano per tutti gli appassionati Apple. Dal 2007, sul nostro sito trovi notizie, recensioni e guide per imparare ad utilizzare al meglio iOS, l'iPhone e tutti gli altri dispostivi dell'azienda.

Contattaci
Pubblicità

Il Network
Il Network

L'esperienza maturata su iSpazio ci ha portati, con il tempo, a realizzare altri progetti ed aprire nuovi siti con tematiche strettamente correlate al nostro Blog principale.

Oggi, siamo i fieri proprietari di un Network composto da: iSpazio, Scontiamolo, Wallpapers Central e Teslers.

Link Rapidi
  • Chi siamo
  • Contattaci
  • Legal
  • Privacy Policy
  • Pubblicità su
© Copyright 2025 iSpazio SRL | Partita IVA: 10137091210
  • Chi siamo
  • Contattaci
  • Legal
  • Privacy Policy
  • Pubblicità su

Scrivi quello che vuoi cercare e premi Invio.