Pavone (Poste): "Ecco come si è creato il baco"

IL CASO

Il responsabile dello sviluppo dei sistemi informativi dell'azienda spiega le origini dell'incidente informatico che ha causato l'impasse. "Una componente software si è bloccata per un'ora provocando la congestione. Scontiamo la nostra dimensione e la complessità dei servizi che eroghiamo, ma la nostra infrastruttura non ha pari"   

di Alessandro Longo
E’ stato un misto di eventi tecnici negativi a mettere in ginocchio il sistema di Poste Italiane. Mentre i problemi proseguono e lo Sviluppo Economico apre un'istruttoria, Poste Italiane prova a fare chiarezza su quanto accaduto, in questa intervista al Corriere delle Comunicazioni. Risponde Giuseppe Pavone, responsabile dello sviluppo sistemi informativi di Poste.
Si è parlato di un problema al mainframe di Ibm. Ma che cosa è successo e come ha potuto impattare su tutti gli sportelli?
Un componente software del mainframe, il VTAM (Virtual Telecommunications Access Method), si è bloccato per un’ora, per un problema che i tecnici di Ibm stanno diagnosticando in queste ore. Quando si è sbloccato, tutti i 60 mila terminali si sono riconnessi al mainframe e così c’è stata una congestione del servizio. Bisogna sapere infatti che la nuova architettura di Poste è centralizzata.
Come funziona?
I computer degli sportelli erogano molti dei propri servizi collegandosi al server centrale via banda larga, tramite la rete Mpls di Poste. E’ un’architettura più efficiente e sicura di quella precedente. In particolare, la piattaforma unica ha un layer di front end per l’accesso ai terminali, un layer applicativo e un layer della base dati.
La centralizzazione ha avuto in questo caso un risvolto negativo, però, visto che si è congestionata l’attività su tutti i terminali periferici
Il problema è che quel blocco di un’ora ha causato uno stress sul database (db2) centralizzato e sui server HP che lo sostengono. C’è stato quindi un rallentamento nell’erogazione dei servizi offerti dalla piattaforma. Il che ha fatto sì che le operazioni tecniche non si sono svolte in modo ordinato. Abbiamo quindi dovuto gestire gli effetti del tutto nei giorni successivi al blocco, smaltendo la coda delle operazioni.
Come è stato possibile arrivare alla congestione del sistema? Immagino che l’avevate sottoposto a test di carico, appunto per prevenire incidenti come questo
Potete dare per scontato che avevamo fatto tutti i test e le prove necessarie. Il lavoro di diagnosi adesso cercherà appunto di scoprire come mai a fronte del blocco c’è stata una tale sofferenza dell’intero sistema. Nelle scorse ore, infatti, abbiamo lavorato perlopiù per rimetterlo in efficienza, applicando le correzioni al componente software, fornite da Ibm.
In generale, bisogna però sapere che è un’infrastruttura proprietaria e non ci sono altre realtà confrontabili con la nostra. Scontiamo la nostra dimensione e la complessità di servizi che eroghiamo.

10 Giugno 2011