Ieri un black out di parte dell’infrastruttura di cloud computing di Amazon ha causato l’interruzione di app e siti web in tutto il mondo, con ripercussioni su utenti, consumatori e aziende. Amazon Web Services ha dichiarato che il guasto, iniziato nelle prime ore del mattino, è stato risolto in serata.
In particolare, Aws ha dichiarato di aver riscontrato “segni significativi di ripresa”, sottolineando che “la maggior parte delle richieste dovrebbe ora andare a buon fine”, mentre continua l’impegno a smaltire il lavoro arretrato.
L’interruzione costituisce uno degli incidenti Internet globali più significativi dopo quello occorso a Microsoft qualche mese fa, che ha visto un aggiornamento difettoso di CrowdStrike paralizzare i sistemi ospedalieri, bancari e aeroportuali di tutto il mondo.
Indice degli argomenti
Le ripercussioni sui servizi digitali delle piattaforme globali
Pur essendo sostanzialmente rientrato, l’incidente evidenzia una volta di più l’estrema fragilità di filiere digitali imperniate su un unico (o su pochissimi) cloud provider: basti pensare che l’emergenza ha interessato più di 70 servizi Aws e ha causato interruzioni diffuse su piattaforme finanziarie, di gioco e di comunicazione.
Come riporta Reuters, il sito di monitoraggio Downdetector ha registrato oltre 4 milioni di segnalazioni da parte degli utenti a livello globale. Sono state colpite piattaforme quali Uber, Perplexity AI, Roblox e Signal, mentre gli utenti del Regno Unito hanno subito interruzioni del servizio da parte di Lloyds Bank, BT, Vodafone, Ring e altri operatori.
Fortnite, Roblox, Clash Royale e Clash of Clans sono stati tra i siti di gaming più coinvolti, mentre Venmo e Chime di Paypal sono state alcune delle piattaforme finanziarie che hanno riscontrato i maggiori problemi. L’interruzione ha colpito anche le app di delivery e di ridesharing, nonché le app di streaming Netflix e Disney+ e la piattaforma di videochat Zoom. Sono stati colpiti anche gli stessi servizi di Amazon, tra cui il sito di vendita al dettaglio, la piattaforma Prime Video e l’assistente vocale Alexa.
I rischi legati all’utilizzo di un’infrastruttura cloud concentrata
Shion Guha, docente di Human-centred Data Science all’Università di Toronto, spiega che anche diverse agenzie a tutti i livelli di governo in Canada utilizzano Aws, il che potrebbe aver causato problemi, ad esempio, nel tentativo di rinnovare la patente di guida. “In sostanza, il nostro punto critico di fallimento risiede nei prodotti di una sola azienda”, spiega il professore. “Pertanto, quando si verifica un’interruzione in un’azienda, si hanno tutti questi effetti a catena su tante altre aziende e agenzie governative”.
Per gli analisti senior di E-Marketer l’evento ha messo a nudo i rischi di un’infrastruttura cloud concentrata e la necessità di una maggiore resilienza negli ecosistemi digitali. Gadjo Sevilla, in particolare, ha affermato che l’interruzione “ha evidenziato quanto il commercio, la comunicazione e l’intrattenimento moderni dipendano profondamente da un unico backbone cloud”, avvertendo che l’eccessiva dipendenza da un unico fornitore “mette a rischio la reputazione del marchio e la fiducia dei clienti”.
Jacob Bourne ha avvertito che “con l’aumentare della dipendenza dal cloud e dei carichi di lavoro, queste interruzioni potrebbero colpire più duramente i settori industriali”. E Grace Harmon ha previsto che in futuro le aziende potrebbero “investire in sistemi di emergenza che consentano agli utenti di passare rapidamente da un fornitore all’altro, come Aws e Microsoft”.
Sebbene non ci siano prove di un attacco informatico dietro l’interruzione, Rafe Pilling, direttore della threat intelligence di Sophos, ha dichiarato a Reuters che “con incidenti come questo, la preoccupazione per un evento informatico è naturale”.
Cosa è successo?
Ma cos’è accaduto, più nel dettaglio? Aws ha spiegato che il problema è stato determinato da un cluster di data center nella Virginia settentrionale, noto come Us-East-1.
In particolare, come riportato dal portale canadese Cbc, un problema con il Domain Name System, o Dns, ha impedito alle applicazioni di trovare l’indirizzo corretto per l’Api DynamoDb di Aws, un database cloud che memorizza le informazioni degli utenti e altri dati critici.
Ian Lin, direttore della ricerca e sviluppo della società di sicurezza informatica Packetlabs, ha spiegato che il Dns traduce gli indirizzi IP numerici in nomi di dominio in modo che gli utenti web possano raggiungere un sito web. Si tratterebbe della terza interruzione di questo tipo in cinque anni all’interno di questo cluster, che rappresenta la sede più longeva e più grande per i servizi web. Ecco perché il disservizio ha avuto ripercussioni così gravi.
Come comportarsi in caso di nuovi disservizi
Dato che non si può escludere che possano ripetersi episodi come quello di ieri, è bene sapere come comportarsi in caso di disservizi. Commentando l’incidente di ieri, Stefanie Schappert, autrice di Cybernews, ha spiegato che criminali informatici e hacker possono facilmente approfittare di questo tipo di interruzioni per sferrare una serie di attacchi di ingegneria sociale.
“Gli hacker che fanno leva sull’urgenza e sul panico di massa vedranno questa situazione come un’opportunità per approfittare delle emozioni intense delle persone con e-mail di phishing che offrono di ‘risolvere’ il problema e di riportarvi online e nei vostri account o app. Ma in realtà, questi truffatori cercano di rubare le tue informazioni personali, come le credenziali di accesso, ingannandoti e convincendoti ad aggiornare il tuo software o a reimpostare la tua password”. Durante le interruzioni di servizio di grande entità, quindi, gli utenti dovrebbero evitare di cliccare su qualsiasi link contenuto in e-mail, sms e pop-up che affermano di poter risolvere il problema.
“Inoltre, ricontrollate che eventuali avvisi o messaggi di aggiornamento provenienti da organizzazioni, come la vostra banca o le app di pagamento, siano verificati dal sito web o dall’app ufficiale”, precisa Schappert. “Questo è il momento di assicurarsi di utilizzare una password forte e l’autenticazione a più fattori per impedire qualsiasi accesso non autorizzato ai propri account”.
Tuttavia, gli utenti dovrebbero anche rimandare le transazioni sensibili, come le operazioni finanziarie importanti, la reimpostazione della password o l’installazione di aggiornamenti software critici, fino a quando il servizio in questione non sarà stato annunciato come ufficialmente ripristinato. “Infine, al termine dell’interruzione del servizio, gli utenti dovrebbero monitorare gli account interessati per individuare attività insolite, discrepanze e transazioni duplicate o fraudolente”, dice l’esperta, che sottolinea che eventi di questo tipo sono “un ottimo promemoria per gli utenti per assicurarsi di disporre di un sistema di backup per accedere a documenti importanti e per le comunicazioni”.