Indica un intervallo di date:
  • Dal Al
cronaca

La Lombardia, l'”algoritmo” sbagliato e l’errore umano. Cronaca critica della diffusione dei dati . Nuova puntata

Ogni settimana la Regione invia i dati i relative ai positivi, guariti, decessi e pazienti in terapia intensiva all’Istituto superiore di sanità (Iss) per calcolare l’indice Rt (qui vi spieghiamo bene cosa misura) che indica il numero medio delle infezioni prodotte da ciascun individuo infetto. Questo indice concorre a definire i colori della mappa delle regioni, cioè quello che si può o non si può fare. Quando una regione ha un Rt superiore a 1,5 finisce tendenzialmente fra le “zone rosse”.  L'”algoritmo” che in realtà è una formula, viene calcolato dall’Iss sulla base dei dati forniti dalle regioni ogni settimana, da aprile non è mai cambiato ed è uguale per tutte le Regioni. Se ve lo volete studiare trovate i materiali qui e qui.

Come vengono compilati i dati? Ogni settimana viene inviato un foglio elettronico che contiene le informazioni relative ai pazienti positivi, i guariti, i decessi e chi è in terapia intensiva. Ogni volta che viene rilevato un caso clinico, viene compilato il relativo campo “stato clinico” nel quale viene indicato il grado di severità dei sintomi, da paucisintomatico a severo e, quando possibile, anche la data della loro insorgenza. Presenza di sintomi e data di insorgenza sono le due variabili che definiscono i soggetti da considerare per il calcolo di Rt.  Questo documento deve contenere informazioni epidemiologiche più dettagliate relative allo stato di sintomaticità. Per esempio, per decidere il colore di una regione conta quando si può uscire dall’isolamento. Il ministero ha deciso tra i 10 e i 21 giorni dalla comparsa dei sintomi. Se queste informazioni non ci sono, sono parziali  può accadere quello che è successo alla Lombardia.

I numeri prima e dopo la “revisione”. Il 22 gennaio il ministero della Salute comunica che i dati forniti dalla Lombardia arrivati il 13 gennaio e non smentiti il 15, giorno di invio da parte dell’Iss del report di monitoraggio nazionale – risultano “sbagliati”, perché corretti con un nuovo invio il 20 gennaio.  Proviamo a ricostruire quello che è successo partendo dalla rettifica dei dati inviati a Roma il 20 gennaio. Sulla base dei nuovi numeri,  sarebbero stati sovrastimati i casi di positivi sintomatici. Più nello specifico è diminuito il numero del “totale dei soggetti positivi con data inizio sintomi o assenza di informazione” (da 419.362 a 414.487) e sarebbe aumentato quello dei positivi “con data inizio sintomi dichiarato stato asintomatico o evidenza di guarigione/decesso senza indicazione di stato sintomatico precedente” (da 234.070 a 246.8549).  Conclusione? Con questa revisione  l’indice Rt è passa da 1,4 a un valore medio di 0,88. Tenendo conto degli altri 21 parametri scelti dal Governo vuole dire per la Lombardia passare da “rossa” ad “arancione”.

Non è chiaro come sia avvenuto l’errore ma è grave che non sia chiaro. Tanto che è in corso una braccio di ferro senza precedenti tra Regione e Ministero della Sanità sulla responsabilità dell’errore. Attilio Fontana, il presidente della Regione Lombardia e Letizia Moratti, il nuovo assessore al Welfare che ha preso il posto di Gallera hanno prima dato colpo all’algoritmo dell’Iss.

 

Dare la colpa all’algoritmo è un po’ come calciare forte la palla fuori dal campo.  Rischia di essere un precedente pericoloso non solo e non tanto per il ruolo che gli algoritmi stanno occupando nella società attuale e a tutti i livelli, si pensi alla polemica delle black box dell’intelligenza artificiale, ma anche perché non aiuta a comprendere i meccanismi decisionali. Gli algoritmi sono strumenti espressione di scelte e valori. Non possono essere responsabili neppure nel caso ci fossero dei bug informatici nel calcolo degli stessi.  Ma il conflitto ora è diventato istituzionale.

La cronaca di quello che è successo. 

A inizio settimana secondo la  Regione Lombardia  la sovrastima era dovuta a un’anomalia dell’algoritmo utilizzato dall’Istituto per l’estrazione dei dati per il calcolo dell’Rt, segnalata dagli uffici dell’assessorato al Welfare della Regione e condivisa con Roma.  In altre parole, la Lombardia non avrebbe mandato dati incompleti e neppure richiesto di rettifica, ma un “necessario aggiornamento di un ‘campo del tracciato’, tracciato che quotidianamente viene inviato all’Istituto Superiore di Sanità”.

La posizione della Regione Lombardia.  In una conferenza stampa sabato 23 gennaio Attilio Fontana ha dichiarato: “Se da domenica la Lombardia tornerà arancione lo deve esclusivamente al fatto che noi abbiamo contestato i conteggi del governo“: ha detto il presidente della Lombardia Attilio Fontana in un punto stampa in Regione con l’assessore al Welfare Letizia Moratti. “Sono indignato da quello che leggo e dalle false notizie offensive per la Lombardia e per le persone che ci lavorano“. Il ministro Speranza, che ha firmato la nuova ordinanza per mettere la Lombardia in zona arancione, “pretendeva che dicessimo che c’era stato un errore nostro. Ma non potevamo accettarlo per la dignità della Regione, per le nostre famiglie e le imprese“, ha spiegato l’assessore Letizia Moratti.

Per il ministero della Sanità invece la Regione Lombardia ha trasmesso dati errati, successivamente ha rettificato i dati propedeutici al calcolo del Rt e questo ha consentito una nuova classificazione.

La risposta dell’Iss.  Il 23 gennaio l’Istituto superiore di sanità ha precisatoche l’algoritmo è corretto e funziona in modo uguale per tutte le Regioni. Anzi, nel merito ha precisato: “La Lombardia, ha segnalato dall’inizio dell’epidemia nell’ultimo periodo, una grande quantità di casi, significativamente maggiore di quella osservata in altre regioni, con una data di inizio sintomi a cui non ha associato uno stato clinico e che pertanto si è continuato a considerare inizialmente sintomatici, in accordo con la procedura sopra descritta. Questa anomalia è stata segnalata più volte dall’ISS alla regione Lombardia“.

Secondo l’Iss la Lombardia dall’inizio dell’epidemia nell’ultimo periodo avrebbe segnalato una grande quantità di casi, significativamente maggiore di quella osservata in altre regioni, con una data di inizio sintomi a cui non ha associato uno stato clinico.  L’Iss li ha considerati in base alla procedura “inizalmente sintomtici”, da qui l’origine della sovrastima.

Questa anomalia, scrivono, è stata segnalata più volte dall’ISS alla regione Lombardia“. Quindi la qualità del dato sarebbe stata bassa da più di una settimana. E questo aggiunge ulteriore incertezza ai dati che vengono usati per decidere quello il colori della mappa e quindi, lo ribadiamo, quello che possono o non possono fare i cittadini.

Arriviamo alla fine di una settimana. E qualche cosa di più emerge. Quantomeno in merito alla catena di trasmissione dati tra la Lombardia e l’Istituto Superiore di Sanità.  Il 26 gennaio arriva un nuovo comunicato dell’Iss in cui vengono ribadite le posizioni del Governo, due i passaggi chiave segnati in neretto: “la percentuale di casi incompleti per la sintomatologia è pari al 50,3% a fronte del 2,5% del resto d’Italia nel periodo 13 dicembre 2020-13 gennaio 2021″;  dal mese di maggio 2020 l’Iss ha inviato 54 segnalazioni di errori, incompletezze e/o incongruenze alla Regione Lombardia, l’ultima delle quali in data 7 gennaio 2021. Andrebbe approfondito quante segnalazioni sono state mandate alle altre regioni ma il sospetto è che l’errore dei dati della Regione Lombardia possa essere iniziato ancora più indietro nel tempo. Il che aprirebbe un contenzioso non solo politico ma anche nei confronti di tutte le attività commerciali (ristoranti, bar  negozi e artigiani) che hanno chiuso perché in zona rossa.

La vicenda non è finita.  La replica del Presidente Fontana non si è fatta attendere con il risorso al tribunale regione. “Aspettiamo fiduciosi il giudizio del Tar del Lazio per dimostrare che abbiamo ragione noi”. “In difficoltà per proprie mancanze – ha commentato –, l’Istituto Superiore di Sanità continua a spostare il tiro da quello che è il vero tema, ovvero il mal funzionamento dell’algoritmo per il calcolo dell’Rt“. Fontana ha parlato di “uscite a orologeria” per “colpire la Lombardia. Non solo dal Governo, ma ora anche da quello che dovrebbe essere un organo terzo come l’Iss E siamo al 30 gennaio 2021.

La questione aperta anzi apertissima dei #datibenecomune. Se c’è stato un errore nella compilazione dei dati diffusi è difficile immaginare che ci sia un singolo “colpevole”, qualcuno che materialmente si è “sbagliato” a inserire un numero. Il sistema di tracciamento dei dati non solo in Lombardia non ha funzionato. Non c’è chiarezza sulle procedure di inserimento dati, sulle procedure di controllo di qualità del dato e, come direbbe un informatico, sul debugging cioè sui metodi per trovare i possibili errori nella compilazione dei dati. Da qui una domanda che è piuttosto ricorrente su questo blog:  cosa sarebbe successo se i dati della Lombardia fossero rilasciati in formato aperto. Se a controllare i dati epidemiologici (in forma disaggregata e nel rispetto della Gdpr) ci fossero stati gli occhi di decine di ricercatori, associazioni, cittadini per monitorare, controllare e aiutare? La risposta non  data. Non lo sappiamo perché i dati sono chiusi. Se vuoi firmare la petizione #datibenecomune,  promossa da Ondata, Transparency International Italia e decine di altre associazioni clicca qui.

Qui gli altri episodi della cronaca critica della diffusione dei dati:
S01E01 So1Eo2 S01E03 S01E04 S01E05 S02E01 S02E02 S02E03 S02E04