Il nostro analizzatore di immagini personale con l’intelligenza artificiale, messo sul nostro computer, a nostra completa disposizione. È quello che otterremmo caricando in locale, ossia su un computer, Llava, un modello multimodale di grandi dimensioni con capacità “visive”. Qui Alessandro Longo vi spiega praticamente come fare e quali sono i vantaggi.
Lo abbiamo provato sul programma Lm Studio. È vero che la multimodalità negli ultimi mesi ha fatto grossi passi avanti ed è disponibile ormai gratis con il nuovo Gpt 4o di OpenAi, anche su app via cellulare. Ci sono però diversi vantaggi a portare su computer un sistema di questo tipo, oltre a scopi didattici ossia per studiare come funzionano questi modelli (che sono alla base di un crescente numero di servizi, quindi farci pratica è una buona idea per il futuro).
Qui l’articolo su Sole24Ore.com
Per approfondire, le altre puntata di Dataviz And Tools
Le altre puntati di Dataviz And ToolsHaiku, Sonnet e Opus riescono a gestire una finestra di contesto da 200.000 token. Cosa vuole dire?
Come funziona l’analisi dei dati su ChatGpt? #DatavizAndTools
Da Project Astra a Veo. Tutte le novità di Gemini presentate al Google I/O 2024 in sei video
AI Overview, come cambia il motore di ricerca di Google con Gemini?
Arriva Gpt-4o, ecco cosa ha di diverso il nuovo chatbot di OpenAI
Cosa è Microsoft Places? Ecco come funziona la nuova applicazione per la gestione dei luoghi
Come si installa e come funziona Phi-3 di Microsoft #DatavizAndTools
Come funzionano le nuove estensioni di Gemini?
Gpt-4, Gemini e Gemini 1.5 Pro. Scopri le differenze
Cerchia e cerca e altre novità Ai di Google sui telefonini Android
Come funziona Sima la nuova Ai di Google che completa i videogiochi al posto vostro
Come funziona e a cosa serve Ecco lo European Statistical Monitor?
Claude 3 di Anthropic è più potente di ChatGPt? Ecco quello che c’è da sapere.
Nasce Genie, il modello di Ai per creare videogiochi da una singola immagine
Ecco cosa promette il generatore di immagini Stable Diffusion 3
Gemma 2B e Gemma 7B. Ecco cosa si può fare con i modelli open source di Gemini
Da Adobe domande e riassunti con l’Ai gen su documenti Pdf
Nasce Sora il modello text-to-video di OpenAi. Ecco come funziona
Come funziona Lumiere l’Ai di Google che genera video dal testo #DatavizAndTools
Microsoft Copilot ora è su tutti gli smartphone. #DatavizAndTools
Come funzionano Nightshade e Glaze? #DatavizAndTools
Fotoritocco, come funzionano Abobe Photoshop Elements e Premiere? #DatavizAndTools
Ecco come funziona Q il nuovo chatbot di AWS? #DatavizAndTools
Ecco come funziona Microsoft 365 Copilot, l’AI generativa entra nelle app di Office
Ecco come funziona GraphCast il nuovo modello per le previsioni meteorologiche globali di DeepMind
Cosa è e come funziona Code Interpreter per Gpt-4?
Come riconoscere immagini e testi generati dall’AI?
La matematica della ricchezza, la disuguaglianza inevitabile e l’econofisica
Wikipedia, l’intelligenza collettiva e gli affari #datavizandtool
Come si costruisce una mappa di Milano con ChatGpt? #datavizandtools
Come funziona MusicGen, il ChatGpt della musica di Meta #DatavizandTools
Bing, come funziona il copilota di Microsoft per il web? #DatavizAndTools
Le ultime novità “audio” dell’Ai generativa #DatavizAndTools
Gpt-4 vs Bard, cinque domande: chi risponde meglio? #howmeasuring
A proposito di mappe, cosa è Overture Maps Foundation? #DatavizAndTools
Ecco le nuove funzionalità di intelligenza artificiale generativa di Photoshop