Quando si parla di salute dell’SSD, la maggior parte delle persone si tranquillizza vedendo la dicitura “Buono” o “Normale” nei programmi di monitoraggio. Ed è comprensibile: aprire CrystalDiskInfo o un software ufficiale del produttore e trovare quella parolina rassicurante fa pensare che tutto vada per il verso giusto. Peccato che quella percentuale non racconti quasi nulla di ciò che sta davvero accadendo alla memoria NAND. Già qui sta il punto: un SSD al 99% o al 95% di vita residua potrebbe aver già incontrato errori irreversibili, e a quel punto affidargli i propri dati diventa un azzardo. Per capire come stanno davvero le cose serve scavare nei dati S.M.A.R.T.
In sostanza, panico per la durata di un disco a stato solido raramente ha senso, perché difficilmente un PC scriverà tanti dati da esaurirne la resistenza. Il problema è un altro, e si nasconde sotto la superficie.
I dati S.M.A.R.T. registrano quasi tutto, ma la percentuale è solo un pezzo
Ogni SSD (e ogni hard disk) registra costantemente gli attributi S.M.A.R.T., una tecnologia di auto monitoraggio capace di conservare fino a 255 informazioni sull’attività dell’unità. La maggior parte dei produttori ne sfrutta solo 20 o 30 per misurare salute, prestazioni e usura, ed è ciò che si vede in strumenti come CrystalDiskInfo o nei software dedicati: SanDisk Dashboard (valido anche per i dischi WD), Samsung Magician, Adata SSD Toolbox e simili.
La percentuale che quasi tutti usano per valutare lo stato deriva dal parametro Percentage Used. Per fare un esempio concreto: un SSD Gen3 può mostrare “5” accanto a questo valore, che si traduce automaticamente in “95%” nello stato di salute in alto. Significa solo che è stato scritto circa il 5% della quantità totale di dati certificata dal produttore tramite il rating TBW. Dà un’idea del chilometraggio, niente di più. Sulla vera condizione del disco non dice assolutamente nulla.
Ecco perché un’unità “sana” può comunque nascondere gravi errori di lettura e scrittura. Bisogna guardare oltre la percentuale e controllare voci come Media and Data Integrity Errors, Critical Warning e Number of Error Information Log Entries. Il primo parametro dovrebbe riportare “0”: qualsiasi altro numero segnala che le celle fisiche hanno iniziato a degradarsi. Quando i meccanismi di correzione ECC non riescono più a recuperare un errore, viene registrato come errore di integrità dei dati. E un valore diverso da zero in quel campo non va mai preso alla leggera.
A far scattare un Critical Warning possono essere lo spazio di riserva disponibile (le celle buffer che sostituiscono quelle ritirate), la temperatura e ovviamente proprio gli errori di integrità. Anche un’unità praticamente nuova può accumularli a causa di improvvisi cali di corrente, surriscaldamento o firmware difettoso. Lo stato di salute non riflette questi eventi.
Cosa fare quando l’SSD comincia a cedere
Se compaiono errori seri, la prima mossa è chiara: fare un backup dei dati, se non è già stato fatto. Un disco compromesso può smettere di funzionare in qualsiasi momento, portandosi via tutto. Separarsi da un’unità che ha ancora gran parte della vita davanti non è facile, ma continuare a usarla quando i dati contano non è un’opzione saggia. Tanti utenti convivono per anni con diverse decine di errori di integrità, magari affidandosi a backup regolari, ma la scelta più sicura resta la sostituzione o l’RMA se l’unità è ancora in garanzia.
Un tentativo che vale la pena fare è l’aggiornamento del firmware, qualora ne sia disponibile uno nuovo: il software del disco lo segnala chiaramente. A volte risolve alla radice il problema all’origine degli errori. Se però il conteggio continua a salire nell’arco di qualche mese o di un anno, allora tocca arrendersi e mandare in pensione il disco.