Gli operatori di data center hanno rafforzato le difese contro i cyber-attacchi e migliorato la resilienza ai problemi tecnici e ai blackout, ma questo non vuol dire abbassare la guardia, come rivela l’ultimo report di Uptime Intelligence (parte di Uptime Institute) “Annual outage analysis 2024” (SCARICA QUI L’EXECUTIVE SUMMARY): evitare le interruzioni nelle infrastrutture digitali resta di primaria importanza per proprietari e gestori dei data center.

Il 55% degli operatori di data center intervistati nel 2023 ha riportato un’interruzione negli ultimi tre anni, in calo rispetto al 60% del 2022 e al 69% del 2021. Inoltre solo un evento su 10 nel 2023 è stato definito come grave, un miglioramento di quattro punto percentuali rispetto al 2022 e di dieci punti rispetto al 2021. Al tempo stesso, quattro su cinque intervistati affermano che il loro caso più recente e più grave di interruzione dell’attività sarebbe stato evitabile con una gestione più efficace e con processi e configurazioni meglio disegnati.

Data center, quanto costano i disservizi

In media, secondo Uptime Institute, avvengono da 10 a 20 interruzioni It o altri eventi gravi per il funzionamento dei data center su scala globale ogni anno, che causano anche notevoli perdite economiche e di reputazione per i gestori e per i loro clienti. In casi estremi, ovvero quando a colpire i data center sono incidenti alla struttura fisica – come eventi climatici, terremoti o incendi – l’impatto è anche sulla sicurezza delle persone.

Anche se i dati sulle interruzioni del servizio hanno un alto livello di incertezza, perché basati sulle rilevazioni degli stessi gestori, la società di analisi sottolinea gli alti costi associati: il 54% delle aziende intervistate ha riportato, per il caso più grave di stop del servizio, un costo superiore a 100mila dollari, mentre per il 16% il costo ha superato 1 milione.

I blackout sono la prima causa di stop

L‘interruzione del servizio elettrico è la causa più comune di un blackout grave del data center. Ciò significa anche un calo o un blackout di qualche frazione di secondo, perché l’hardware It non ha tolleranza rispetto alle interruzioni dell’alimentazione elettrica. Al contrario, i problemi nelle strutture per il raffreddamento sono ben tollerati per periodi “lunghi” di tempo, ovvero qualche minuto.

I problemi intrinseci all’infrastruttura It sono anche più frequenti, ma hanno un impatto spesso più isolato e meno grave; di solito colpiscono specifiche applicazioni o singoli dataset.

Le interruzioni legate al fornitore esterno (third-party provider) sono lievemente ma costantemente aumentate dal 2020; nel 2023 registrano un +5% e rappresentano un “down” su 10 per i data center. Questo incremento riflette il crescente ricorso al cloud e all’hosting e ai fornitori di software as a service (SaaS) e di servizi di colocation.

Data center più resilienti, ma emergono nuovi rischi

Nonostante l’andamento positivo sul fronte cybersicurezza e resistenza alle interruzioni It e lungo la rete elettrica, non c’è spazio per l’autocompiacimento (e il sondaggio di Uptime mostra che i gestori di data center ne sono consapevoli): i tassi di interruzione del servizio restano preoccupanti. E gli alti costi finanziari collegati a questi eventi mantengono la resilienza in cima agli obiettivi di tutto l’ecosistema.

Fra i trend evidenziati ci sono il passaggio al public cloud– che non significa meno problemi, ma solo che “third-party supplier” diventa una causa più frequente di interruzione del servizio It rispetto alle interruzioni sul data center on-premises – e l’instabilità della rete elettrica che, incorporando più fonti rinnovabili e assumendo caratteristiche più dinamiche, può determinare una crescente inaffidabilità.

Altri fattori che influenzeranno sempre più la resilienza dei data center sono il cambiamento climatico – con temperature molto alte, inondazioni, incendi più frequenti, e così via – e l’adozione di nuove tecnologie per migliorare proprio la resistenza dei data center. Per esempio, l’uso di strumenti software per spostare i carichi di lavoro dinamicamente o del liquid cooling per il raffreddamento delle strutture migliorano la resilienza, ma possono aumentare i rischi perché sono tecniche che vanno gestite.

