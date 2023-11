Sono 9 i principi che i leader di infrastrutture e operazioni (I&O) devono implementare per massimizzare la resilienza degli ambienti cloud. Ad illustrarli è un’analisi di Gartner, il cui Senior Director Analyst Chris Saunderson spiega: “Il cloud non è magicamente resiliente e sono i bug del software, non i guasti fisici, a causare quasi tutte le interruzioni. Queste non coinvolgono quasi mai l’intero fornitore di servizi, né è probabile che siano totali. Sono invece tipici guasti parziali, degradi del servizio, singoli problemi di servizio o problemi locali”.

“La resilienza non è uno stato binario”

Il team I&O è in sostanza tenuto a comprendere le caratteristiche e le cause comuni delle interruzioni del cloud, tenendo presente che la maggior parte di esse tende a essere intermittente o comporta un degrado delle prestazioni laddove sono meno immediatamente evidenti, e che esistono differenze di resilienza tra i servizi offerti dai fornitori di servizi cloud. “La resilienza non è uno stato binario”, puntualizza Saunderson. “Nessuno può rivendicare una resilienza assoluta, né tu né alcun fornitore di servizi cloud. I cloud dovrebbero essere altrettanto o addirittura più resilienti dell’infrastruttura on-premise, ma solo se il team I&O li utilizza in modo resiliente”.

I 9 principi chiave per migliorare la resilienza

Gli analisti di Gartner consigliano quindi ai leader I&O di concentrarsi su 9 principi chiave per migliorare la resilienza del cloud.

Allineamento aziendale

Allineare i requisiti di resilienza alle esigenze aziendali. Senza questo allineamento sui requisiti, i team non riusciranno a soddisfare le aspettative di resilienza o spenderanno troppo.

Approccio basato sul rischio

Adottare un approccio basato sul rischio per la pianificazione della resilienza che vada oltre gli eventi catastrofici. Porre maggiore enfasi sugli errori più comuni che le organizzazioni hanno un maggiore controllo per mitigare.

Mappatura delle dipendenze

Crea grafici delle dipendenze che mappano tutti i componenti middleware, i database, i servizi cloud e i punti di integrazione in modo che possano essere progettati e configurati per la resilienza e inclusi nella pianificazione dell’affidabilità e del disaster recovery (DR).

Disponibilità continua

L’approccio alla disponibilità continua si concentra sul mantenimento di applicazioni, servizi e dati sempre disponibili e a livelli di servizio senza tempi di inattività e con un impatto limitato durante un evento di guasto.

Resiliente fin dalla progettazione

L’applicazione stessa dovrebbe essere resiliente fin dalla progettazione. La resilienza dell’infrastruttura da sola non è sufficiente per fornire i servizi senza downtime che gli utenti finali si aspettano.

Automazione DR

L’implementazione di un ripristino di emergenza (DR) completamente (o quasi) automatizzato, tramite gli strumenti dell’organizzazione o strumenti DR nativi del cloud di terze parti, fornisce le basi necessarie per soddisfare obiettivi di tempo di ripristino (RTO) aggressivi e consente di testare regolarmente il DR.

Standard di resilienza

Adottare standard di resilienza che vadano oltre l’architettura e il DR. I sistemi resilienti richiedono che i team si concentrino su qualità, automazione e miglioramento continuo e infondano qualità durante l’intero ciclo di vita di un’applicazione.

Privilegiare soluzioni cloud-native

I fornitori di servizi cloud dispongono di una gamma significativa di soluzioni che possono essere utilizzate per migliorare la resilienza. Laddove fattibile, i leader I&O dovrebbero trarre vantaggio da queste soluzioni anziché cercare di inventare le proprie alternative e aggiungere ulteriore complessità.

Focus sulle funzioni aziendali

Piuttosto che limitare il pensiero al solo “failing over” simile, esplorare alternative, come alternative IT leggere o sostituzioni applicative leggere che forniscono le funzionalità minime essenziali per l’azienda richieste.

