Indica un intervallo di date:
  • Dal Al
cronaca

Grafico del decennio: la data discovery del cinque per mille

In questi dieci anni diverse volte (qui, qui, qui, qui  e infine qui) Info Data è tornata a raccontare la destinazione del cinque per mille scelta dai contribuenti italiani.

La scelta di presentarvi questa Info Data come quella per il decennio che si sta per chiudere ha una ragione di “backstage”: è stata la prima affrontata con un grado di complessità elevato in tutte le fasi della lavorazione. E, una volta pubblicata, ha sempre ricevuto un’ottima accoglienza da parte dei lettori che hanno ripagato i molti sforzi fatti per la sua realizzazione.

Con le loro dichiarazioni dei redditi, un fiume di denaro ha permesso di far crescere il terzo settore in Italia secondo un modello funzionale: ciascuno contribuisce in misura della propria Irpef versata e ha la possibilità di scegliere a quale ente o associazione o, più recentemente, comune, destinare questo denaro, poco o tanto che sia.

Dietro le quinte
Ogni anno la prima sfida si ripropone identica: quella di trasformare un elenco in formato pdf proveniente dal Ministero dell’Economia in una tabella strutturata fatta da migliaia e migliaia di righe, normalizzando i dati e costruendo, in definitiva, un database.

Purtroppo, questa noiosa e rischiosa (per i possibili errori derivanti) attività di trasformazione è abbastanza comune quando si ha a che fare con informazioni pubbliche provenienti da amministrazioni. Anziché rilasciare questi contenuti, se non in formato open data almeno in un modo facilmente gestibile (un foglio di calcolo, ad esempio, sarebbe sufficiente) gli enti molto spesso preferiscono file derivati, quali appunto il Pdf, o dashboard che mostrano grafici senza tuttavia mostrare una tabella con i valori sottostanti.

La creazione del dataset
Il foglio di calcolo derivato è l’ossatura del dataset finale. A questo vengono associate ulteriori informazioni di contesto, prese da altre fonti (ad esempio la popolazione di ciascun comune) che permetteranno i calcoli.

I dati, purtroppo, vanno riconciliati molto spesso a mano. Facciamo un esempio: la città di Sesto San Giovanni, in provincia di Milano, può essere anche scritta “Sesto S. Giovanni”, “S. S. Giovanni”, “Sesto San Giov.” e via dicendo. Occorre pertanto individuare tutte le occorrenze (ossia i casi) in cui il sistema non riesce ad associare correttamente il nome tra l’elenco del cinque per mille e quello degli altri valori (per la popolazione, ad esempio, Istat) e sistemarli a mano, uno per uno.

La data discovery
A questo punto il team di Info Data si interroga sui possibili risultati, ponendo ai dati tutte le domande (nella speranza che siano intelligenti o perlomeno curiose) che ci vengono in mente.

Tra le risposte ottenute vengono poi scelte quelle che sono ritenute più interessanti per i lettori. In questi casi, ad esempio, la chiave di letture scelta è spesso stata quella che riguarda i contribuenti più ricchi, i quali possono cambiare la sorte finanziaria di una onlus con solo una o poche donazioni. Dividendo la cifra ottenuta da un ente per il numero dei contribuenti, si ottiene la donazione media. In molti casi questa è decisamente alta, ma in rari casi è veramente stratosferica. Una associazione di Jesi, ad esempio, nel 2016 (riferendosi all’anno di imposta 2014) ha ricevuto un contributo medio di quasi 6mila euro, che corrisponde ad una Irpef pagata di 1.200.000 euro, e quindi un reddito di più del doppio. In media, ovviamente.

La progettazione
Successivamente la progettazione dell’Info Data interattiva cerca di tenere conto dei messaggi che si vogliono comunicare e delle modalità con cui un lettore interroga il dataset. In questo caso lo scopo delle scelte è stato quello di mostrare come un numero ridotto di associazioni ottengano il grosso della quota destinata, mentre una miriade di migliaia di piccoli enti compongono la galassia dei beneficiari che racimolano quale migliaio di euro (nel migliore dei casi), ma molto più spesso solo qualche decina.

Inoltre, tramite funzionalità di ricerca, pensiamo che al lettore possa interessare quanti soldi riceverà la propria associazione o il proprio comune. Come cifra della costruzione delle Info Data, cerchiamo, laddove possibile, di fare in modo che l’utente personalizzi l’esperienza sulla base di propri criteri personali, vedendo solo quella porzione di dati, o quella porzione di dati calcolata sulla base degli interessi individuali.

Per concludere
In questi dieci anni, in questa come in molte altre occasioni, Info Data ha cercato di fornirvi chiavi di lettura originali sui dati, non fermandosi alle sole evidenze più eclatanti ma cercando di farvi scoprire aspetti specifici e particolari. Connettendo altre fonti, permettendovi di “giocare” con i dati in prima persona e infine, attraverso le parole, raccontandovi il contesto come chiave di lettura delle informazioni numeriche. Non sempre ci siamo riusciti, ma ci abbiamo sempre provato.