Abbiamo già parlato di Overture Maps Foundation (OMF), ossia del tentativo di rendere le mappe scaricabili da tutti. Una chiara risposta alle Big Tech sviluppatrici di cartografia proprietaria, come Google ed Apple. Ma come funziona? Per fare una panoramica dello strumento, come Info Data abbiamo intervistato Maurizio Napolitano, coordinatore del laboratorio Digital Commons Lab della Fondazione Bruno Kessler di Trento ed esperto di mappe digitali.
Da esperto, come è Overture Maps Foundation?
Rappresenta il risultato di un percorso intrapreso dalle multinazionali che si sono unite per affrontare la sfida della disponibilità globale di dati geografici. Hanno trovato in Open Street Map una risorsa che risolve le loro esigenze ed ha quindi spinto loro a collaborare anche condividendo i propri dati, tracciando così un percorso analogo, seppur più accelerato, rispetto a quello percorso da Linux. La Linux Foundation, in questo contesto, non solo fornisce il terreno fertile per questa collaborazione, ma offre anche soluzioni che semplificano notevolmente il processo complessivo.
Qual è l’intento che ha mosso grandi aziende come Meta, Microsoft, Amazon e TomTom nella definizione di questo strumento?
Come detto precedentemente, Open Street Map è stato il punto d’unione, ma quello che è ancora più importante sta nel raccontare come ciascuna di queste aziende è arrivata a Open Street Map. Come primo esempio partiamo dal caso di Meta: dal momento che Facebook ha cominciato a mostrare mappe nei profili di aziende ed organizzazioni, si è posto il problema di usare una mappa propria. L’uso di una mappa creata da terzi poteva non risultare vincente, in quanto era una sorta di ingresso per possibili concorrenti. Pertanto si è scelto, anche per portare avanti un proprio design, di cominciare a creare le mappe internamente. La prima azione è stata quella di comprare i dati da fornitori (es. here) o da quelli rilasciati da pubbliche amministrazioni. Ma, arrivati in Thailandia, ci si è accorti che queste risorse non erano disponibili e l’unica con una buona copertura era Open Street Map. Da qui tutto un progetto molto importante che ha dato vita a servizi che ora vengono usati anche in ambito degli aiuti umanitari dove, i dati di edifici e di strade che Meta rileva tramite AI da immagini satellitari, vengono poi validati ed inseriti in Open Street Map da parte della comunità. Amazon, invece, ha cominciato ad utilizzare il grafo stradale di Open Street Map per ottimizzare le consegne dei propri corrieri ed ha poi cominciato a raccogliere informazioni di dettaglio. Passando a Microsoft, questa fa largo uso di Open Street Map (non va dimenticato che, in passato, Steve Coast – creatore di Open Street Map – ha lavorato in Microsoft e successivamente in TomTom). Per capirci, basterebbe aumentare lo zoom su Bing Maps per accorgersi che appare la scritta Open Street Map in basso a destra, fra le sorgenti utilizzate. Infine, TomTom ha cominciato a guardare Open Street Map per il livello di dettaglio che per loro è strettamente necessario nell’ottimizzazione del calcolo dei percorsi.
Tuttavia, i dati di Open Street Map richiedono molta cura per quanto riguarda il loro riuso. OMF, quindi, ha cominciato a definire il proprio standard, rielaborando non solo i dati di Open Street Map, ma anche quelli che ciascuna delle aziende che ne fanno parte ha deciso di mettere a disposizione. Unendosi hanno ottimizzato questo lavoro, creando una fondazione aperta e rilasciando uno spazio dove creare una comunità che lavori anche in sinergia con Open Street Map e che permetta a chiunque di migliorare questo bene comune.
Se ha avuto modo di utilizzare lo strumento, reputa i meccanismi di estrapolazione dei dati facili e gestibili anche da utenti base?
Allo stato attuale, i dati sono rilasciati in maniera intelligente, secondo quelle che sono le ultime tecnologie (si tratta di 200Gb in formato parquet, un formato altamente performante, efficiente, ottimizzato per archiviare, scrivere e leggere dati tabellari strutturati a colonna). Questo fa sì che si possano interrogare questa grande mole di dati come se fosse un database. Certo, le performance dipendono molto dalla banda che si ha a disposizione e dalla potenza del proprio computer. Overture Maps Foundation fornisce su GitHub tutte le istruzioni su come interfacciarsi ai dati attraverso i servizi cloud di Amazon (Athena) o Microsoft (Synapse). Per chi però non vuole fare uso di questi strumenti (evitando di registrarsi su queste piattaforme), c’è anche la documentazione per interfacciarsi con l’ottimo, potentissimo e velocissimo prodotto open source DuckDB.
Mi rendo però conto che l’apprendimento di questi strumenti, per chi è un utente base, richiede molto tempo e quindi può facilmente scoraggiare. Inoltre, alcune interrogazioni possono risultare abbastanza complesse. Attualmente, la pagina GitHub sta ricevendo parecchie proposte di miglioramento della documentazione, fra cui anche le indicazioni su come accedere ai dati attraverso Apache Sedona (un sistema di cluster computing open source per l’elaborazione di dati spaziali su larga scala) e sicuramente a breve avremo sempre più documentazione che renderà il tutto più agevole. Su questo però si tratta di avere solo un po’ di pazienza, in quanto con una comunità già ora così attenta a quello che OMF ha esposto, appariranno in brevissimo tempo servizi di download in formati diversi e su aree precise per cui è auspicabile che si potranno avere semplici link dove scaricare i dati, divisi per aree geografiche o amministrative. Personalmente sto lavorando nel tempo libero ad un tutorial proprio per venire incontro a queste esigenze, ma sono certo ci sarà chi lo farà prima di me.
Maurizio Napolitano ha inoltre reso fruibili dei dati di OMF riguardanti gli edifici italiani. I file sono divisi per regione ed arricchiti con rilevazioni Istat per facilitare la navigazione su comuni o province. Per dare completezza al lettore, noi di Info Data ve li riportiamo al seguente link.
Maurizio Napolitano, capo dell’unita Digital Commons Lab del centro Digital Society della Fondazione Bruno Kessler. Civic hacker per natura, si occupa prevalentemente di open data, visualizzazione dei dati e analisi geospaziali. Grande sostenitore di OpenStreetMap
Cosa è Datavizandtools. Sezione del blog dedicata alla comprensione e alla comunicazione dei dati. Troverete articoli, brevi lezioni e video per raccontare le novità, spiegare come funzionano i nuovi tools e aiutare cittadini e professionisti a comprendere meglio le mappe, i grafici e i numeri nelle notizie (e viceversa). Collaborano professori, data scientist e giornalisti di dati.
Per approfondire.
“Dati aprendi”, aiutaci a monitorare quelli che dovrebbero essere open data ma non lo sono
Ecco Apache Superset. Tutto quello che c’è da sapere. Nasce #datavizandtools