blank

Il giorno del 4 Ottobre è stato sicuramente difficile da digerire per le aziende di proprietà di Mark Zuckerberg, Facebook, Instagram e WhatsApp infatti, hanno visto il blocco dei servizi più longevo della loro storia, le tre piattaforme sono infatti rimaste non funzionanti per tutto il tardo pomeriggio fino a tarda serata, non permettendo agli utenti di sfruttarne le funzionalità completamente a causa appunto di un blocco totale.

Ovviamente scoperto il blocco, tutti hanno subito pensato ad un attacco da parte di un gruppo hacker in cerca di fortune all’interno dei servers di Facebook, ed effettivamente il pensiero ha senso in quanto un blocco di queste dimensioni non si era mai visto nella storia del colosso che ovviamente vanta un’infrastruttura in grado di reggere problemi di grossa portata.

 

Ecco cosa è successo

Innanzitutto sappiate che non c’è stato alcun attacco hacker, la piattaforma social ha confermato che nessuno ha cercato di rubare i nostri dati, anzi, circa 4 ore dopo l’inizio del down proprio Facebook ha rilasciato una nota ufficiale per spiegare quanto accaduto, eccola qui:

A tutte le persone e le aziende in tutto il mondo che dipendono da noi, ci scusiamo per l’inconveniente causato dall’interruzione odierna delle nostre piattaforme. Abbiamo lavorato duramente per ripristinare l’accesso e ora i nostri sistemi sono di nuovo operativi. La causa alla base di questa interruzione ha avuto un impatto anche su molti degli strumenti e dei sistemi interni che utilizziamo nelle nostre operazioni quotidiane, complicando i nostri tentativi di diagnosticare e risolvere rapidamente il problema.

I nostri team di ingegneri hanno appreso che le modifiche alla configurazione sui router dorsali che coordinano il traffico di rete tra i nostri data center hanno causato problemi interrompendo questa comunicazione. Questa interruzione del traffico di rete ha avuto un effetto a cascata sul modo in cui comunicano i nostri data center, interrompendo i nostri servizi.

I nostri servizi sono ora di nuovo online e stiamo lavorando attivamente per riportarli completamente alle normali operazioni. Vogliamo chiarire in questo momento che riteniamo che la causa principale di questa interruzione sia stata una modifica alla configurazione errata. Inoltre, non abbiamo prove che i dati degli utenti siano stati compromessi a causa di questo tempo di inattività.

Persone e aziende in tutto il mondo si affidano a noi ogni giorno per rimanere in contatto. Comprendiamo l’impatto che interruzioni come queste hanno sulla vita delle persone e la nostra responsabilità di tenere le persone informate sulle interruzioni dei nostri servizi. Ci scusiamo con tutte le persone colpite e stiamo lavorando per capire di più su ciò che è successo oggi in modo da poter continuare a rendere la nostra infrastruttura più resiliente.

Quanto accaduto sostanzialmente è legato ai protocolli BGP ossia i cosiddetti Border Gateway Protocol, in breve, questi protocolli indicano la strada migliore e più veloce che i dati devono fare per raggiungere Facebook e viceversa, al momento di un aggiornamento da parte di un dipendente però, qualcosa è andato storto e i sistemi hanno smesso di funzionare, con i servizi di Facebook scomparsi dal web, se si cercava il social non si veniva indirizzati da nessuna parte.

Il vero e paradossale problema è legato al fatto che le piattaforme personali di gestione dei data center dei dipendenti sfruttano come base il sistema Facebook, il quale però essendo bloccato negava l’accesso, non permettendo dunque a chi sapeva come risolvere il problema, di accedere e appunto procedere, dopo circa 6 ore Facebook è venuta a capo di tutto grazie ad alcuni elementi che sapevano dove mettere le mani nel database fisicamente.