Indica un intervallo di date:
  • Dal Al
tecnologia

Giornalismo di dati, le nostre impressioni su Code Interpreter, il plugin di Gpt-4 per programmatori, data scientist e analisti finanziari

A metà luglio come abbiamo scritto OpenAi ha rilasciato il plug-in interno Code Interpreter. E’ in versione Beta e ha l’ambizione di colmare la lacuna dei modelli di linguaggio di grandi dimensioni sul fronte delle scienze dure. Detto più semplice è un plugins che ha “studiato” programmazione, statistica e matematica per venire incontro alle necessità di sviluppatori di Phyton, matematici, data analyst e data scientist. In pratica può convertire file, modificare le immagini, scrivere codice in linguaggio Python, analizzare un foglio di calcolo e generare grafici e mappe interattive. Capite bene perché chi legge questo Blog sia piuttosto interessato a questa applicazione di Ai generativa. Spoiler, quello che state leggendo è un riassunto, a breve pubblicheremo un video con le nostre prove, ma possiamo già dire che nella noiosa ripulitura dei dati pur con qualche imprecisione il tool di Gpt-4 si è rivelato particolarmente efficace. Detto più facile, si risparmia davvero un sacco di tempo.

Cosa è Code Interpreter.

Tecnicamente è un interprete di Python in grado di accedere al vostro disco fisso.  Quindi scrive ed esegue un pezzo di codice informatico per trovare la risposta. Ciò consente al chatbot di compiere nuove attività che non faceva prima, come eseguire calcoli complicati e generare grafici basati su dati che l’utente carica, tutto completato tramite codice Rispetto s ChatGPT, con Code Interpreter  puoi scrivere codice ed eseguire le applicazioni all’interno dell’interfaccia del chatbot. Un esempio? Se gli chiedete di calcolare una derivata seconda o un integrale e quindi di eseguire una formula matematica, Gpt-4 scrive ed esegue il codice per calcolare la risposta esatta.  Con ChatGpt invece il sistema andava a cercare al risposta nei dataset caricati.

Cosa puoi fare? 

Partiamo dalla gestione delle immagini. Puoi animarle, zoom in, zoom out,  ridimensionare un’immagine, ruotare e capovolgere un’immagine e aggiungere del testo a un’immagine  nulla di particolarmente sofisticato ma funzione. Meglio se glielo spiegate bene. Per esempio, caricate su Zip una serie di immagini Zip che magari avete generato utilizzando prog rammi di Ai generativa come Midjourney o Stable Diffusion usando zoom- out. Ricordatevi di rinominarle in ordine alfabetico, poi specificare durata e Fps (Frame per second). Potete anche usare una foto panoramica e scrivere un prompt con una regia in modo da generare una vera e propria animazione. Utilizzando librerie specifiche tipo Pillow o OpenCV, si possono convertire immagini in video, documenti PDF in immagini, e altro ancora

Programmazione?

Non si possono istallare pacchetti di Python. Quindi non si può fare quello che si vuole. E occorre ricordarsi ti tenere la sessione attiva e di salvare perché altrimenti si perdono tutti i dati. Tuttavia, abbiamo a disposizione un ambiente sandbox e protetto da firewall con preinstallate oltre 300 librerie e pacchetti. Per esempio avete Panda per la gestione e analisi dei dati, numpy per i calcoli numerici, matplotlib per la visualizzazione dei dati e OpenCV per le attività di visione artificiale. Come funziona? Genera un codice, uno script di Pyton e lo esegue in backend. Volendo potete anche fare copia e incolla. Inoltre, se qualcosa non funziona vi aiuta a trovare i bug. C’è un limite nella dimensione dei file. Attenzione che una volta che i file caricati vengono eliminati dopo l’uscita dalla sessione di chat. Alcuni usi? Scrittura di algoritmi per automatizzare attività,  debugging e risoluzione dei problemi di codice esistenti, integrazine di Api e come vedremo ora creazione di script per estrarre dati.

Analisi dataset e creazione di grafici

Per creare un grafico, si può utilizzare una libreria Python come Matplotlib. Abbiamo provato anche dataset non banali (3mila righe e alcune decine di colonne) e li ha digeriti bene. Supporta vari formati di file, inclusi CSV, JSON e molto altro. Basta caricare  il Csv e puoi ottenere la rappresentazione del dato specificando nel prompt il grafico che vuoi visualizzare. Prima analizza i dati e se glielo chiedi ti propone una dataviz o gli algoritmi migliori per visualizzare i dati. Non solo analizza anche gli andamenti, clusterizza e propone delle descrizioni. Oltre a dirvi le cose basilari come media, mediana ecc, può rispondere a domande più complesse. Per esempio, estrae tabelle Pivot facilmente. Ha commesso qualche errore quando gli abbiamo chiesto di confrontare due distribuzioni. Mentre ci sono volute più domande e precisazioni quando gli abbiamo chiesto di visualizzare alcune estrapolazioni in modalità R. L’aspetto più sorprendente è che tutto avviene con il linguaggio naturale. . Certamente devi conoscere la statistica che sta dietro all’analisi dei dati. Il software è utile solo se si ha una comprensione chiara di come interagire e interpretare i risultati. Il limite è quello dei 25 messaggi ogni 3 ore. Come sappiamo stiamo utilizzando Gpt-4 a pagamento e ha attualmente questi limiti. Vuole dire che in attesa di imparare dei prompt che lui capisca al volo potrebbero servire non pochi passaggi per spiegargli bene quello che volete. Di buono c’è che suggerisce quali dataset utilizzare e quindi quali informazione gli mancano quando non capisce esattamente quello che volete.

Finanza, e-commerce e marketing. Glii analisti possono sfruttare il Code Interpreter di ChatGPT per effettuare indagini approfondite su dataset finanziari con record su andamenti azionari, prezzi e opzioni disponibili. Si possono usare per esempio librerie come Pandas e Matplotlib. Si possono analizzare  dati di vendita per identificare tendenze e modelli, visualizzare il comportamento dei clienti su un sito Web di e-commerce e dentificare le aree di risparmio sui costi o crescita dei ricavi sulla base dell’analisi dei fondamentali di una società. Può anche essere utilizzato per il marketing con analisi di sentiment se gli dati i risultati di sondaggi.

Cosa ne pensiamo. Non è potentissimo ma è potente. Non è un ambiente di sviluppo e non vuole essere probabilmente. Commette degli errori? Sì e a volte non capisce quello che gli stiamo chiedendo. Inoltre, occorre avere molto chiaro quello che si vuole e come ottenerlo. Quindi non è adatto per chi si improvvisa data analyst. Diciamo che è un luogo dove realizzare piccole cose che però possono servire. Si risparmia molto tempo. Sopratutto se sei un junior.

Per approfondire.

Cosa è e come funziona Code Interpreter per Gpt-4?

Come riconoscere immagini e testi generati dall’AI?

La matematica della ricchezza, la disuguaglianza inevitabile e l’econofisica

Wikipedia, l’intelligenza collettiva e gli affari #datavizandtool

Da Harry Potter mafioso agli ultimi videogiochi ripensati a 8 bit. L’Ai generativa continua a divertire #datavizandtools

Come si costruisce una mappa di Milano con ChatGpt? #datavizandtools

Come funziona MusicGen, il ChatGpt della musica di Meta #DatavizandTools

Bing, come funziona il copilota di Microsoft per il web? #DatavizAndTools

Le ultime novità “audio” dell’Ai generativa #DatavizAndTools

Gpt-4 vs Bard, cinque domande: chi risponde meglio? #howmeasuring