Questo sito utilizza cookie per raccogliere informazioni sull'utilizzo. Cliccando su questo banner o navigando il sito, acconsenti all'uso dei cookie. Leggi la nostra cookie policy.OK

Pavone (Poste): “Ecco come si è creato il baco”

Il responsabile dello sviluppo dei sistemi informativi dell’azienda spiega le origini dell’incidente informatico che ha causato l’impasse. “Una componente software si è bloccata per un’ora provocando la congestione. Scontiamo la nostra dimensione e la complessità dei servizi che eroghiamo, ma la nostra infrastruttura non ha pari”   

10 Giu 2011

E’ stato un misto di eventi tecnici negativi a mettere in
ginocchio il sistema di Poste Italiane. Mentre i problemi
proseguono e lo Sviluppo Economico apre un'istruttoria,
Poste Italiane prova a fare chiarezza su quanto accaduto, in questa
intervista al Corriere delle Comunicazioni. Risponde Giuseppe
Pavone, responsabile dello sviluppo sistemi informativi di
Poste.
Si è parlato di un problema al mainframe di Ibm. Ma che
cosa è successo e come ha potuto impattare su tutti gli
sportelli?

Un componente software del mainframe, il VTAM (Virtual
Telecommunications Access Method), si è bloccato per un’ora, per
un problema che i tecnici di Ibm stanno diagnosticando in queste
ore. Quando si è sbloccato, tutti i 60 mila terminali si sono
riconnessi al mainframe e così c’è stata una congestione del
servizio. Bisogna sapere infatti che la nuova architettura di Poste
è centralizzata.
Come funziona?
I computer degli sportelli
erogano molti dei propri servizi collegandosi al server centrale
via banda larga, tramite la rete Mpls di Poste. E’
un’architettura più efficiente e sicura di quella precedente. In
particolare, la piattaforma unica ha un layer di front end per
l’accesso ai terminali, un layer applicativo e un layer della
base dati.
La centralizzazione ha avuto in questo caso un risvolto
negativo, però, visto che si è congestionata l’attività su
tutti i terminali periferici
Il problema è che quel
blocco di un’ora ha causato uno stress sul database (db2)
centralizzato e sui server HP che lo sostengono. C’è stato
quindi un rallentamento nell’erogazione dei servizi offerti dalla
piattaforma. Il che ha fatto sì che le operazioni tecniche non si
sono svolte in modo ordinato. Abbiamo quindi dovuto gestire gli
effetti del tutto nei giorni successivi al blocco, smaltendo la
coda delle operazioni.
Come è stato possibile arrivare alla congestione del
sistema? Immagino che l’avevate sottoposto a test di carico,
appunto per prevenire incidenti come questo
Potete
dare per scontato che avevamo fatto tutti i test e le prove
necessarie. Il lavoro di diagnosi adesso cercherà appunto di
scoprire come mai a fronte del blocco c’è stata una tale
sofferenza dell’intero sistema. Nelle scorse ore, infatti,
abbiamo lavorato perlopiù per rimetterlo in efficienza, applicando
le correzioni al componente software, fornite da Ibm.
In generale, bisogna però sapere che è un’infrastruttura
proprietaria e non ci sono altre realtà confrontabili con la
nostra. Scontiamo la nostra dimensione e la complessità di servizi
che eroghiamo.