Claude Code finisce sotto la lente di un dirigente AMD, e le critiche non sono affatto leggere. Un’analisi interna attribuita a una figura di rilievo dell’azienda ha messo in discussione l’affidabilità dello strumento di Anthropic dedicato all’assistenza nella scrittura del codice, definendolo incline a fornire soluzioni superficiali e incomplete. Una posizione piuttosto netta, che arriva in un momento in cui l’intelligenza artificiale sta diventando parte integrante dei flussi di lavoro nello sviluppo software, con un’adozione che cresce mese dopo mese.
Claude Code è pensato per assistere i programmatori nella scrittura, nella revisione e nella comprensione del codice. Sfrutta modelli linguistici avanzati (i famosi LLM) per generare porzioni di codice, suggerire correzioni e spiegare logiche di programmazione. Fin qui, nulla di diverso da altri strumenti simili sul mercato. Il problema, stando a quanto emerso, è che il sistema mostrerebbe comportamenti definiti “pigri”: in pratica, tenderebbe a restituire risposte semplificate soprattutto quando le richieste diventano complesse e richiedono un’analisi più approfondita. E per chi lavora su progetti articolati, questo rappresenta un limite tutt’altro che trascurabile.
Perché Claude Code sembra “pigro” e cosa c’è davvero dietro
Uno degli aspetti più criticati riguarda la capacità di gestire problemi con molte variabili. I modelli linguistici generano risposte su base probabilistica, il che significa che tendono a privilegiare soluzioni plausibili piuttosto che ottimali. Nel contesto dello sviluppo software, questo si traduce in codice che può funzionare nei casi più semplici ma che non tiene conto di scenari limite, problemi di performance o questioni legate alla sicurezza. La mancanza di profondità analitica diventa quindi un problema concreto, non una semplice percezione.
Va detto che il comportamento descritto non nasce da una reale “pigrizia” dello strumento, ma è legato a caratteristiche proprie dei modelli su cui si basa. L’ottimizzazione per la velocità e per la coerenza linguistica porta spesso a generare soluzioni concise, evitando i percorsi più complessi che richiederebbero un’elaborazione maggiore. Inoltre, i modelli tendono a fermarsi alla prima soluzione ritenuta soddisfacente secondo criteri statistici, senza esplorare alternative più solide. Il risultato è un approccio che, visto dall’esterno, appare appunto superficiale.
Claude Code non è l’unico: il problema è più ampio
Le critiche mosse ad AMD verso Claude Code non sono un caso isolato. Problemi simili emergono anche con altri strumenti basati su LLM, soprattutto quando si tratta di ragionamento complesso o di ottimizzazione avanzata del codice. La differenza tra uno strumento e l’altro sta spesso nel tuning del modello e nell’integrazione con sistemi di analisi statica o runtime, elementi che possono migliorare sensibilmente la qualità delle risposte generate.
Per chi sviluppa software, il messaggio è abbastanza chiaro: non ci si può affidare completamente all’intelligenza artificiale per la produzione di codice critico. L’AI resta un supporto, non un sostituto. Pratiche di revisione, test e validazione rimangono fondamentali, perché l’automazione può accelerare la scrittura del codice ma non ne garantisce automaticamente la qualità o la correttezza.
Per provare a superare questi limiti, i produttori stanno investendo in tecniche come il chain of thought prompting e l’integrazione con sistemi di verifica automatica, approcci che puntano a migliorare la capacità dei modelli di affrontare problemi complessi in modo più strutturato. L’affidabilità completa, però, resta un obiettivo ancora distante: i modelli continuano a essere strumenti probabilistici, con tutti i limiti che questo comporta.