Indica un intervallo di date:
  • Dal Al
cronaca

Nasce il COVID-19 Public Dataset Program (e offre l’uso di Big Query)

Si chiama  COVID-19 Public Dataset Program ed è un archivio di dataset pubblici, liberamente accessibili e consultabili. L’inziativa di Google, sostengono a Mountain View, nasce per aiutare ricercatori, data scientist e analisti nella lotta contro il coronavirus. Il dataset è anonimizzato (non sono gestite o inserite informazioni personali identificabili (PII) né informazioni private sulla salute (PHI))  e per leggere l’annuncio ufficiale sul loro post dovete andare qui. In pratica, si accede a questo indirizzo. Si ha accesso ai dati della Johns Hopkins University, quelli della celebre mappa che ha mostrato la diffusione del contagio, come ai dati del Global Health Data della Banca Mondiale o a quelli di OpenStreetMap. Nulla di veramente inaccessibile o inaspettato per chi in queste settimane si è esercitato a mettere il naso nei dataset sul coronavirus. Quindi non aspettatevi di trovare dati nuovi o frutto di operazioni di scraping importanti. Interessante è invece la possibilità offerta di usare BigQuery ML per preparare modelli avanzati di machine learning con questi dati direttamente all’interno di BigQuery, senza costi aggiuntivi. Il programma rimarrà in vigore fino al 15 settembre 2020.

Lo sviluppo di modelli basati sui dati per analizzare la diffusione di questa malattia infettiva è fondamentale“, ha affermato Matteo Chinazzi, ricercatore associato presso la Northeastern University. “Il nostro team sta lavorando intensamente per creare modelli che ci aiutino a comprendere meglio la diffusione di COVID-19. Rendendo i dati su COVID-19 aperti e disponibili in BigQuery, i ricercatori e le autorità sanitarie saranno in grado di comprendere, studiare e analizzare meglio l’impatto di questa malattia”.