In occasione delle recenti elezioni regionali in Liguria, InfoData aveva provato ad utilzzare Claude.ai, un modello di intelligenza artificiale sviluppato da Anthropic, per estrarre i dati relativi ai risultati. La richiesta all’AI quella di scrivere un codice che interrogasse il portale Eligendo per ottenere le percentuali ottenute dai candidati alla presidenza in ciascun comune.
Un esperimento in parte fallito, per via della modalità con cui il ministero dell’Interno identifica i comuni al voto. Ovvero attraverso un codice elettorale, ibrido dei codici che Istat assegna a regioni, province e comuni e di quello con cui il Viminale identifica le circoscrizioni elettorali. L’AI aveva infatti generato uno script in Python che costruiva l’url delle pagine sulle quali erano pubblicati i dati di ciascun comune, le caricava sul browser ed estraeva i risultati. Il punto è che InfoData non era stata in grado di ricostruire il codice numerico assegnato a tutti i comuni. In particolare, per 8 comuni liguri non era stato possibile estrarre i dati.
Le elezioni regionali in Emilia Romagna ed Umbria dello scorso fine settimana hanno rappresentato l’occasione per ripetere l’esperimento. Grazie ad una segnalazione del presidente di onData Andrea Borruso, che ha indicato una pagina del sito del ministero sulla quale sono riportati i codici elettorali e quelli Istat di ciascun comune, questa volta InfoData è riuscita a fornire all’intelligenza artificiale in maniera corretta i codici per costruire le url da interrogare. E, come mostra la mappa che apre questo pezzo, l’esperimento è riuscito.
Nella mappa i comuni che tendono al rosso sono quelli nei quali si è imposta la candidata del centrosinistra Stefania Proietti, poi eletta alla presidenza della regione. Quelli in blu, invece, sono quelli nei quali ha ottenuto più consensi la presidente uscente, Donatella Tesei, sostenuta dal centrodestra. Ci sono voluti indicativamente una ventina di minuti perché lo script estraesse tutti i dati per salvarli in un file .csv. E l’Emilia Romagna? Qui la vicenda è stata un po’ più complessa.
Come si vede da questa mappa, anche in questo caso l’esperimento è riuscito. C’è stato, però, un piccolo inciampo. Nel senso che lo script realizzato dall’intelligenza artificiale ha estratto i dati relativi a tutti i comuni con l’eccezione dei 27 che formano la provincia di Rimini. Anche in questo caso, il problema era legato al codice numerico con cui il Viminale identifica i singoli comuni. Avendo a che fare con pochi dati, è stato sufficiente l’occhio umano per individuare l’errore. Corretto il quale, Claude ha scritto un codice che ha limitato l’estrazione alla sola provincia di Rimini.
Sono bastati quindi una decina di minuti, dopo che lo script relativo all’intera regione aveva lavorato per circa un’ora, per estrarre i dati mancanti. E consentire così a InfoData di completare la mappa. Anche in questo caso, il rosso indica un’affermazione del candidato del centrosinistra Michele De Pascale, poi eletto, il blu invece della sfidante Elena Ugolini, sostenuta dal centrodestra.
Al di là delle mappe, il tema è che InfoData è riuscita con successo ad utilizzare un modello di intelligenza artificiale per realizzare uno script che consentisse di estrarre i dati relativi ai risultati elettorali. Uno sforzo che rimane necessario fintantoché il Viminale non deciderà di rilasciarli in open data.
Gli script utilizzati per estrarre i dati ed i dati estratti sono disponibili su GitHub.
Per approfondire.
Come costruire la mappa del voto (in Liguria) con Claude,il modello di Ai di Anthropic
Com’è cambiata la geografia politica italiana dopo le elezioni europee