Pnrr, cosa è il catalogo nazionale dei dati Istat? L'interoperabilità semantica spiegata bene.

Istat, in collaborazione con il Dipartimento per la trasformazione digitale della Presidenza del Consiglio dei Ministri, ha attivato il 30 giugno 2022 il Catalogo Nazionale Dati per l’interoperabilità semantica dei sistemi informativi delle pubbliche amministrazioni. Lo trovate qui cliccando il portale di accesso al Catalogo Nazionale Dati. L’obiettivo di fornire un modello e uno standard comune e favorire lo scambio, l’armonizzazione e la comprensione delle informazioni tra le amministrazioni pubbliche, nell’ambito della Piattaforma Digitale Nazionale Dati e del Single Digital Gateway (lo Sportello Digitale Unico, anch’esso previsto dal PNRR). In sostanza verrà messa a disposizione di tutte le Pa e dei privati un vocabolario comune e classificazioni per potere sapere diciamo tutti dove sono le informazioni e quello che vogliono dire. L’operazione non è affatto banale, come si può immaginare perché comporta la mappatura delle banche dati e dei flussi informativi. E anche le forme di accesso ai dati.

Un esempio? Se una azienda, una ente della Pa o un privato vuole sviluppare servizi digitali ha bisogno di sapere dove sono i dati e cosa vogliono dire. Risulta difficile creare nuovi servizi se i dati scambiati non hanno un significato chiaro (ad esempio se si confonde il nucleo familiare con la famiglia anagrafica, o un tampone molecolare con uno rapido). Detto in modo più difficile, Istat deve garantire quella che viene definita l’interoperabilità semantica cioè la capacità di garantire che il formato e il significato delle informazioni scambiate siano preservati e compresi durante gli scambi tra le parti.

Quali problemi risolve il catalogo? Ogni nuovo servizio in teoria non dovrà richiedere lo sviluppo di codice ad-hoc per validare, interpretare ed uniformare i dati ricevuti da enti diversi. Il catalogo può semplificare ed uniformare la creazione e la gestione della modulistica online e dei servizi digitali fruibili anche tramite siti web. Ad esempio, un comune invece di ridefinire i possibili titoli di studio e la loro sintassi, potrà riusare tramite API i valori pubblicati dal catalogo a partire dal vocabolario nazionale education-level.csv.

Cosa vuole dire che il catalogo è open source? Diciamo subito che è una buona notizia. Perché tutti i soggetti interessati possono contribuire al miglioramento del catalogo aprendo una issue in uno dei repository menzionati. Trovate le informazioni di frontend e backend del catalogo nei seguenti repositories: https://github.com/teamdigitale/dati-semantic-backend https://github.com/teamdigitale/dati-semantic-frontend Puoi contribuire al miglioramento del catalogo aprendo una issue in uno dei repository menzionati.

Inoltre i dati provengono da fonti ufficiali. Cioè le ontologie, i vocabolari controllati e gli schemi dati sono scaricati dai repository ufficiali (e.g. Github o Gitlab) degli enti della pubblica amministrazione. Il catalogo scarica i dati contenuti nella directory che ha subito l’aggiornamento più recente. I dati provengono da fonti ufficiali in quanto ogni ente è titolare dei metadati pubblicati.

Chi ci lavora? Per lo sviluppo del Piano progettuale, che prevede un budget di 10,7 milioni di euro, è richiesto un importante impegno di risorse umane con elevate competenze, da reclutare mediante nuove assunzioni. Per l’Istat, specificatamente, è prevista la selezione di un contingente fino a 25 persone a tempo pieno, con competenze tecniche, tematiche, metodologiche e giuridiche.

Per contribuire. Qui trovate tutte le informazioni.

“A proposito di dati” è una rubrica di Info Data per segnalare novità e nuove policy sui dati sia in ambito pubblico che privato. Per segnalare novità e nuove policy sui dati sia in ambito pubblico che privato. Se avete segnalazioni scriveteci infodata@ilsole24ore.com