l'intervento

PA e intelligenza artificiale, così i dati diventano il vero motore della trasformazione digitale

L’esperienza di CSI Piemonte mostra come cataloghi informativi, metadati affidabili e governance possano rendere i sistemi intelligenti strumenti concreti di conoscenza condivisa e innovazione amministrativa.

Pubblicato il 4 mag 2026

Michaela Elisa Jackson

Architetture e Tecnologie Innovative CSI Piemonte

Giorgio Nocerino

Architetture e Tecnologie Innovative CSI Piemonte

AI-intelligenza-artificiale, Data Governance AI PA

Chiedi all'AI

Riassumi questo articolo

Approfondisci con altre fonti

C’è una domanda che attraversa silenziosa ogni ente pubblico di medie e grandi dimensioni: dove sono i nostri dati, chi li conosce davvero, e a chi appartengono? La risposta, spesso frammentata tra sistemi legacy, basi dati non documentate e memoria organizzativa custodita da poche persone chiave, nasconde in realtà una straordinaria opportunità: quella di riscoprire e valorizzare un patrimonio informativo già esistente, trasformandolo da asset latente in motore di decisioni migliori, servizi più efficaci e politiche più mirate.

Riuscire a ritrovare, comprendere e governare il proprio patrimonio informativo significa liberare energia organizzativa oggi dispersa in attività ridondanti, ricerche manuali e riconciliazioni tra fonti non allineate. Significa dare agli analisti, ai responsabili di procedimento e ai decision maker un’unica fonte di verità condivisa: sapere che quel dataset esiste, dove si trova, chi ne è responsabile, com’è fatto, come può essere usato e con quali vincoli. È un cambio di paradigma organizzativo prima ancora che tecnologico.

In questo scenario si apre una finestra di opportunità straordinaria, resa ancora più concreta dall’evoluzione demografica che sta ridisegnando la PA italiana. Nei comuni italiani l’età media dei dipendenti è passata da 49,5 anni nel 2011 a 52,3 anni nel 2021, con la fascia 55-59 anni come la più rappresentata nell’intero comparto pubblico. Questo dato può diventare un acceleratore di trasformazione: la conoscenza tacita accumulata in decenni di esperienza può essere finalmente resa esplicita, condivisa e duratura, trasformandosi in patrimonio istituzionale stabile e riusabile.

Indice degli argomenti

L’automazione intelligente come leva di modernizzazione

I numeri dell’Osservatorio Agenda Digitale del Politecnico di Milano mostrano con chiarezza il potenziale di questa trasformazione: il 57% del tempo lavorativo dei dipendenti pubblici è potenzialmente automatizzabile, non per ridurre l’occupazione ma per liberare risorse cognitive verso attività a maggiore valore aggiunto. Nello stesso orizzonte, entro il 2033 l’AI potrà compensare un impatto equivalente a 3,8 milioni di lavoratori, in un sistema che dovrà confrontarsi con un gap demografico stimato in 5,6 milioni di persone rispetto alle necessità del sistema previdenziale. L’automazione intelligente diventa così una leva concreta di modernizzazione della PA.

La vera originalità di questa sfida sta nel riconoscere che AI e Data Governance non sono due traiettorie parallele da inseguire separatamente: sono una relazione duale e circolare, in cui ciascuna abilita e moltiplica il valore dell’altra. Da un lato, l’AI è oggi l’unico strumento in grado di rendere sostenibile la costruzione e il mantenimento di un catalogo dati su patrimoni informativi della dimensione e complessità di quelli della PA, automatizzando discovery, classificazione e profilazione della qualità. Dall’altro, è proprio la Data Governance, e in particolare un Data Catalog ben strutturato, a diventare la condizione abilitante affinché l’AI operi in modo affidabile, contestualizzato e conforme: non un generico modello linguistico, ma un agente che conosce regole, significati e limiti specifici dell’organizzazione in cui agisce.

Questo doppio movimento — l’AI che costruisce la governance, la governance che abilita l’AI — è il filo conduttore dell’esperienza che CSI Piemonte sta portando avanti per una grande regione italiana, e il cuore di ciò che i due capitoli seguenti cercano di raccontare.

L’Intelligenza Artificiale per la Data Governance – Le macchine sognano di governare metadati sintetici?

Chiedete a qualsiasi dirigente di una grande Pubblica Amministrazione italiana se la sua organizzazione ha una Data Governance strutturata. La risposta, nella stragrande maggioranza dei casi, sarà un sorriso imbarazzato. Non per mancanza di consapevolezza, anzi, il tema è ben presente, ma perché tutti sanno cosa comporta davvero: definire chi è responsabile di ogni dato, costruire un catalogo di tutto il patrimonio informativo, assegnare ruoli di data steward, mantenere aggiornate le classificazioni. Un lavoro enorme, continuo, trasversale a tutta l’organizzazione. Un lavoro che nessuno ha voglia di fare.

E qui sta il vero nodo. Non tecnologico, non normativo: antropologico. La Data Governance fallisce quasi sempre per la stessa ragione: chiede alle persone di assumersi responsabilità nuove, senza togliere nulla di quello che già fanno. Il data steward, la figura incaricata della cura del dato, è il ruolo che nessuno vuole. Nelle matrici organizzative appare, ma nei fatti nessuno lo presidia davvero. Perché richiede tempo, attenzione e senso di responsabilità su qualcosa che non produce risultati visibili nel breve periodo.

Questo è lo scenario che CSI Piemonte incontra quotidianamente nel supportare Regione Piemonte e circa 140 enti pubblici nella gestione di un ecosistema informativo che supera i 10 petabyte di dati, distribuiti su centinaia di sistemi, per oltre 4 milioni di cittadini. Un ecosistema reale, vivo, caotico come ogni grande organizzazione pubblica. E una sfida che non è peculiare del Piemonte: ogni regione italiana, ogni grande comune, ogni ministero si trova davanti allo stesso muro.

Il Data Catalog AI-powered della Regione Piemonte

È per rispondere a questa sfida che CSI Piemonte ha avviato l’iniziativa di Master Data Management per Regione Piemonte: un Data Catalog AI-powered — basato su tecnologia open source — che punta a portare ordine sui processi della Regione, costruendo per la prima volta una fonte unica di verità condivisa per le entità fondamentali dell’ente. Non un progetto astratto di governance, ma un cantiere aperto in cui l’AI fa già il lavoro che nessun team umano potrebbe sostenere da solo: scoprire, classificare, profilare e documentare un patrimonio informativo che cresce ogni giorno.

Il patrimonio informativo cresce, i sistemi si moltiplicano, i dati si frammentano — e governarli con le sole forze umane disponibili è, semplicemente, impossibile.

La svolta arriva con l’Intelligenza Artificiale generativa. Non come soluzione magica, ma come cambio di prospettiva radicale sul come si fa Data Governance. Finché catalogare significava che qualcuno doveva sedersi, aprire ogni dataset, descriverlo, classificarlo, assegnargli metadati, verificarne la qualità — il processo era destinato a restare incompiuto. Oggi non è più così.

Cosa fa concretamente l’AI nel Data Catalog? Molto più di quanto si immagini. Un sistema AI-Powered è in grado di:
• Scoprire automaticamente i dataset distribuiti nei sistemi aziendali, senza intervento manuale, mappando strutture, formati e relazioni tra tabelle
• Classificare i contenuti assegnando tag tematici, categorie di sensibilità e livelli di accesso, anche su dati non strutturati come documenti e testi
• Profilare la qualità del dato in modo continuo, segnalando anomalie, duplicati, valori mancanti e inconsistenze tra fonti
• Generare descrizioni dei dataset in linguaggio naturale, abbozzando automaticamente la documentazione che il data steward deve solo rivedere e validare

Il ruolo del data steward nell’organizzazione ibrida

Il cambio di paradigma per il change management è decisivo: l’AI non aggiunge lavoro, lo trasforma. Il data steward non scompare, ma smette di essere colui che cataloga e diventa colui che valida e supervisiona ciò che l’AI ha già fatto. Un ruolo più leggero, più sostenibile, più accettabile. Il tempo liberato dall’automazione viene reindirizzato verso le decisioni che richiedono davvero giudizio umano: disambiguare un contesto normativo, risolvere un conflitto tra definizioni, stabilire chi ha diritto di accesso a un dato sensibile.

Questo è il modello che si sta costruendo in Piemonte — e che ogni regione italiana potrebbe replicare, perché la sfida è identica ovunque: grandi patrimoni informativi, risorse umane limitate, e una pressione crescente a usare i dati in modo affidabile per prendere decisioni che impattano i cittadini.

La Commissione Europea, negli orientamenti per un’IA affidabile, disegna esattamente questo equilibrio: supervisione umana nei punti critici — human-in-the-loop, human-on-the-loop, human-in-command — con i sistemi automatici a gestire il volume e la complessità che nessuna squadra umana potrebbe sostenere da sola. Con l’agentic AI, questo scenario si spinge ancora oltre: agenti artificiali specializzati potranno presidiare in autonomia interi segmenti del catalogo, restituendo all’uomo solo le eccezioni che richiedono giudizio contestuale. Una task force ibrida, in cui umani e macchine cooperano — e in cui, finalmente, la Data Governance smette di essere il progetto che si rimanda sempre all’anno prossimo

La Data Governance per l’Intelligenza Artificiale – La Legge Zero inizia da dati e metadati

“Un robot non può recare danno all’umanità, né può permettere che, a causa del proprio mancato intervento, l’umanità riceva danno” — (Isaac Asimov, Robots and Empire, 1985).

È ormai evidente che l’Intelligenza Artificiale non governata responsabilmente secondo principi etici può recare danni all’uomo. Il principio asimoviano della Legge Zero trova oggi una forma di applicazione concreta non nella volontà delle macchine, ma nella capacità delle organizzazioni di governare i dati, i metadati e i contesti in cui i modelli operano.

Se l’IA rappresenta un acceleratore per la Data Governance, l’altra faccia della medaglia è che l’Intelligenza Artificiale è solida solo quanto lo è l’ecosistema informativo su cui poggia [cite:1]. Lo scenario può assumere forme diverse, con un crescendo che parte dalla costruzione di modelli predittivi addestrati su dati propri, passa dalle applicazioni più semplici di GenAI basate su general purpose AI model di terze parti, fino ad arrivare a sistemi agentici complessi.

Machine Learning

Garbage in, garbage out. Forse meglio quality in, quality out. È ciò che succede in tutti i sistemi fortemente basati sui dati, anche nel machine learning. Quando i modelli vengono addestrati su dataset ben definiti e circoscritti, governare l’IA significa, prima di tutto, governare i dati. Quando una Pubblica Amministrazione addestra un modello predittivo con dati di cui è owner, la Data Governance aderisce alla sua radice più classica: il modello è letteralmente plasmato dai dati, e un dato inaccurato diventa un’inferenza errata, valori duplicati creano pattern distorti, campi incoerenti generano comportamenti imprevedibili.

La qualità del dato è strettamente intrecciata alla gestione dei bias. Nella struttura statistica dei dataset i modelli apprendono le asimmetrie, reali o forzate, del mondo; in molti contesti pubblici, lasciare che un modello apprenda da distribuzioni distorte significa rischiare di rafforzare classi dominanti, ignorando quelle meno rappresentate e ponendo le basi per trattamenti discriminatori nei confronti dei cittadini.

Una Data Governance matura porta però un beneficio ulteriore, ancora poco discusso ma straordinariamente rilevante per la PA: la possibilità di generare dati sintetici. Quando il patrimonio informativo è ben descritto — con metadati sintattici precisi (strutture, formati, distribuzioni statistiche) e semantici ricchi (definizioni, relazioni tra concetti, regole di business) — diventa possibile addestrare modelli generativi capaci di produrre dati artificiali statisticamente fedeli agli originali, ma privi di qualsiasi informazione personale reale. Un’opportunità concreta per rispondere alle stringenti prescrizioni del GDPR e dell’AI Act: la PA può sviluppare, testare e condividere modelli AI senza mai esporre dati reali sui cittadini. La Data Governance, insomma, non è solo il presupposto per usare bene i dati che si hanno — è la condizione per poter creare, in modo controllato e conforme, i dati che servono.

GenAI e sistemi agentici

Con l’avvento della GenAI e, ancor più, dei sistemi agentici, questo paradigma non basta più. Una Pubblica Amministrazione che utilizzi un modello general purpose in una propria soluzione applicativa non ha alcun controllo sui dati su cui esso è stato addestrato: non può correggerli, bilanciarli, pulirli, né ricostruirne la provenienza completa. In questo scenario, il governo del dato in senso tradizionale perde efficacia, mentre diventa centrale governare tutto ciò che “avvolge” il modello.

I modelli linguistici di grandi dimensioni non apprendono solo pattern numerici: operano su linguaggio, concetti e relazioni semantiche. Quando vengono inseriti in sistemi capaci di agire, interrogando basi dati, orchestrando processi e prendendo decisioni operative, il problema non è più soltanto quali dati vengono usati, ma come quei dati vengono interpretati.

Il controllo si sposta allora dai dati ai metadati: semantica, contesti applicativi, regole di privacy, contratti di utilizzo, logiche di contenimento, processi di validazione e monitoraggio. Ed è qui che rientra in gioco il Data Catalog — in una forma completamente nuova.

Non più solo strumento operativo per catalogare asset informativi: il catalogo diventa il layer semantico di riferimento per i sistemi AI. È lì che si dice all’AI cosa significa “beneficiario”, come si distingue un “contributo” da un “trasferimento”, quali dataset possono essere interrogati in quale contesto e con quali vincoli. Per i sistemi agentici — quelli capaci di agire autonomamente su più passaggi — questo riferimento non è un’opzione: è la differenza tra un agente che opera in modo affidabile e uno che, pur rispettando la forma, viola la sostanza.

Il catalogo come base di conoscenza organizzativa

Siamo, in altri termini, di fronte a una nuova frontiera del Knowledge Management applicato alla PA. L’obiettivo finale non è soltanto avere un catalogo dati ben tenuto: è costruire una base di conoscenza organizzativa strutturata — fatta di definizioni condivise, relazioni tra concetti, regole di utilizzo, contesti normativi — che un sistema agentic possa interrogare esattamente come farebbe un esperto dell’organizzazione. Un agente che sa cosa significa un termine nel contesto di quella specifica regione, quali vincoli normativi si applicano a quel processo, quali fonti sono autorevoli per quale dominio. Non un assistente generico, ma un collega digitale che conosce davvero l’organizzazione in cui opera

Per l’agentic AI, quel riferimento diventa ancora più necessario e vincolante: delimita ciò che gli agenti artificiali possono interrogare, come devono interpretarlo e in quali condizioni è legittimo trasformarlo in azione. Il controllo non è esercitato sul singolo modello, ma sull’intero ecosistema.

Il data catalog diviene così lo scrigno digitale che custodisce il contesto, cui hanno contribuito umani e macchine, di tutte le dimensioni indispensabili per l’interpretazione e l’utilizzo coerenti dei dati, strutturati e non. In esso significati, regole e limiti diventano espliciti, riducendo il rischio che sistemi più o meno autonomi compiano azioni formalmente corrette ma concettualmente sbagliate.

Il cerchio si chiude. E in quel cerchio — fatto di significati espliciti, regole condivise, contesti documentati — risiede la garanzia più concreta che l’intelligenza artificiale nella PA italiana possa essere non solo efficace, ma giusta. Per CSI Piemonte, che supporta questa trasformazione da quasi cinquant’anni, presidiarla non è una scelta tecnologica: è una responsabilità istituzionale. Il Consorzio non si limita a fornire infrastrutture, ma accompagna gli enti nella costruzione del contesto semantico e regolatorio entro cui i sistemi intelligenti sono chiamati ad agire — assicurando che l’automazione si sviluppi in modo conforme e allineato alle responsabilità degli enti verso i cittadini.

@RIPRODUZIONE RISERVATA