Google entra nell'”Agentic Era”: ha presentato una nuova versione del suo modello di intelligenza artificiale di punta, affermando che è due volte più veloce della versione precedente e sarà utilizzata per alimentare agenti virtuali che assistono gli utenti. Dice Sundar Pichai, il ceo di Google – qui trovate la cronaca dell’annuncio sul Sole 24 Ore.com – il passaggio è dagli LLM tradizionali a modelli di AI che sono in grado di comprendere l’ambiente circostante, anticipare le esigenze e agire autonomamente sotto supervisione”. Nonostante siano ancora in una fase prototipale, questi progressi suggeriscono un futuro in cui Ai agent sofisticati giocheranno un ruolo centrale nelle interazioni digitali. Oltre ai prodotti sperimentali, Google ha integrato più intelligenza artificiale nel suo motore di ricerca, che rimane il fulcro del suo business. Molti gli annunci e le novità. Vediamoli in sintesi.
Si parte con il modello sperimentale Gemini 2.0 Flash di Google che sarà disponibile per tutti gli utenti Gemini. Ora nella mani di sviluppatori e tester fidati verrà in gemini Gemini e Search. Basandosi sul successo del suo predecessore, Gemini 1.5 Flash, 2.0 Flash offre prestazioni migliorate pur mantenendo tempi di risposta rapidi
Arriva Deep Research, l’assistente intelligente alla ricerca. L’annuncio più interessante è una funzione chiamata Deep Research, che utilizza capacità avanzate di ragionamento e di contesto lungo per agire come un assistente di ricerca, esplorando argomenti complessi e compilando rapporti per conto dell’utente. È disponibile da oggi in Gemini Advanced», riassume il manager. È disponibile da oggi in Gemini Advanced. Per esempio, Deep Research utilizza l’AI per esplorare argomenti complessi per te e fornirti i risultati in un report completo e di facile lettura. Un esempio? Puoi chiedere a Gemini di scandagliare il web per tuo conto e di redigere un rapporto basato sulle sue scoperte.
Google ha presentato anche gli sviluppi di progetti sperimentali, che rientrano nell’ambito “agenti AI”. Sistemi che fanno azioni per conto dell’utente, con un certo livello di autonomia.
Un altro è Project Mariner: un agente AI che sta sul nostro browser e fa azioni per noi. In pratica è una Ai che usa il computer da solo. Un esempio mostrato nella presentazione: gli chiedi di navigare su siti di certe aziende e raccogliere i dati di contatto e quello lo fa in automatico, dandoti poi le informazioni. Su agenti integrati nel sistema operativo o in applicativi stanno lavorando anche Microsoft e Anthropic. Stesso discorso per Jules, un agente per i programmatori, come mostrato da Google con questi annunci. Si integra direttamente in un flusso di lavoro GitHub.
E poi c’è il gaming. Come abbiamo visto con Genie, in questo caso Gemini 2.0 diventa un agente che offre suggerimenti su cosa fare sul videogioco basandosi esclusivamente sull’azione sullo schermo, tramite una conversazione in tempo reale
E poi c’è Overview Ai. Infine è stato spiegato che sono state introdotte le capacità di ragionamento avanzato di Gemini 2.0 nelle Schede AI del suo motore di ricercao. Ricordiamo che Overview Ai, il nuovo engine sperimentale di Alphabet che risponde con link e linguaggio naturale e che è candidato in prospettiva ad affiancarsi a Google Search, non è ancora presente in Europa per questioni legate alla normativa. L’assenza, promettono da Mountain View durerà poco. Molte di queste novità le vedremo dal 2024. Ma Deep Research lo proveremo appena potremo su Ascanio.
Per approfondire.
Le novità di Google: da Project Astra a Veo, in sei video
Gemini sbarca su iPhone. Ecco cosa cambia #DatavizAndTools
Gemini Live parla in italiano. I limiti e le potenzialità #DatavizAndTools
Gemini entra in Google Maps. Ecco cosa cambia e qualche altra novità
Le novità dell’Ai Gen arrivano su Google Maps
Arrivano le nuove mappe super-dettagliate di Google
Ecco come funziona l’immersive View di Google Maps che ora arriva a Firenze e Venezia
Meno soste ai semafori e più attenzioni ai consumi energetici. Le novità di Google Maps
Come funziona Veo, la nuova Ai generativa dedicata ai video?
Le altre puntata di Dataviz And Tools
Come funzionano Nova, i nuovi modelli di Ai per le immagini e i video di Aws?
ChatGpt Pro a 200 dollari e Gpt o1: ecco tutte le novità
Google anticipa Sora e lancia dentro Vertex Ai Veo, la nuova Ai generativa dedicata ai video
Cosa può fare la nuova versione di Minerva 7B? #DatavizAndTools
Gemini sbarca su iPhone. Ecco cosa cambia #DatavizAndTools
Musica, Dream Track è in fase di test. Ecco perché è una rivoluzione
Disponibile ChatGpt per Windows. Ecco cosa cambia
Claude 3.5 Sonnet ora può analizzare i documenti in PDF, anche i grafici #DatavizAndTools
Gemini entra in Google Maps. Ecco cosa cambia e qualche altra novità
Claude di Antrophic impara a usare il computer come un essere umano #DatavizAndTools
Come funziona Firefly Video Model di Adobe? #DatavizAndTools
ChatGPT ora parla come noi #DatavizAndTools
Microsoft ha aggiornato Copilot. Ecco come si è evoluto
NotebookLM di Google trasforma i vostri documenti in podcast
Come funziona Firefly Video Model di Adobe?Matematica, catena di pensiero e coding. Cosa ha di diverso o1 di OpenAI?
Cosa sono e a cosa servono i servizi Gems di Gemini? #Ainews
Midjourney è accessibile a tutti via web e offre 25 crediti
Vi ricordate SearchGpt, il motore di ricerca di OpenAi? Cosa sappiamo finora?
Imagen 3 debutta negli Usa. Ecco cosa sappiamo del modello di Ai di Google
Cosa è e come funziona PartyRock?#DatavizAndTools
Come funziona Claude 3.5 Sonnet e cosa sa fare: i test superati #DatavizAndTools
DeepMind presenta V2A la nuova Ai per creare suoni e colonne sonore per i video
Ecco Luma Dream Machine, il nuovo tool di visual storytelling. La nostra recensione
Ecco come funziona DeepL Enterprise, l’Ai linguistica per le aziende della startup tedesca
Come funziona Italia 9B e quali vantaggi dà un large language model italiano?
Llava è un modello multimodale di grandi dimensioni con capacità “visive”. Ecco come funziona
Haiku, Sonnet e Opus riescono a gestire una finestra di contesto da 200.000 token. Cosa vuole dire?
Come funziona l’analisi dei dati su ChatGpt? #DatavizAndTools
Da Project Astra a Veo. Tutte le novità di Gemini presentate al Google I/O 2024 in sei video
AI Overview, come cambia il motore di ricerca di Google con Gemini?
Arriva Gpt-4o, ecco cosa ha di diverso il nuovo chatbot di OpenAI
Cosa è Microsoft Places? Ecco come funziona la nuova applicazione per la gestione dei luoghi
Come si installa e come funziona Phi-3 di Microsoft #DatavizAndTools
Come funzionano le nuove estensioni di Gemini?
Gpt-4, Gemini e Gemini 1.5 Pro. Scopri le differenze
Cerchia e cerca e altre novità Ai di Google sui telefonini Android
Come funziona Sima la nuova Ai di Google che completa i videogiochi al posto vostro
Come funziona e a cosa serve Ecco lo European Statistical Monitor?
Claude 3 di Anthropic è più potente di ChatGPt? Ecco quello che c’è da sapere.
Nasce Genie, il modello di Ai per creare videogiochi da una singola immagine
Ecco cosa promette il generatore di immagini Stable Diffusion 3
Gemma 2B e Gemma 7B. Ecco cosa si può fare con i modelli open source di Gemini
Da Adobe domande e riassunti con l’Ai gen su documenti Pdf
Nasce Sora il modello text-to-video di OpenAi. Ecco come funziona
Come funziona Lumiere l’Ai di Google che genera video dal testo #DatavizAndTools
Microsoft Copilot ora è su tutti gli smartphone. #DatavizAndTools
Come funzionano Nightshade e Glaze? #DatavizAndTools
Fotoritocco, come funzionano Abobe Photoshop Elements e Premiere? #DatavizAndTools
Ecco come funziona Q il nuovo chatbot di AWS? #DatavizAndTools
Ecco come funziona Microsoft 365 Copilot, l’AI generativa entra nelle app di Office
Ecco come funziona GraphCast il nuovo modello per le previsioni meteorologiche globali di DeepMind
Cosa è e come funziona Code Interpreter per Gpt-4?
Come riconoscere immagini e testi generati dall’AI?
La matematica della ricchezza, la disuguaglianza inevitabile e l’econofisica
Wikipedia, l’intelligenza collettiva e gli affari #datavizandtool
Come si costruisce una mappa di Milano con ChatGpt? #datavizandtools
Come funziona MusicGen, il ChatGpt della musica di Meta #DatavizandTools
Bing, come funziona il copilota di Microsoft per il web? #DatavizAndTools
Le ultime novità “audio” dell’Ai generativa #DatavizAndTools
Gpt-4 vs Bard, cinque domande: chi risponde meglio? #howmeasuring
A proposito di mappe, cosa è Overture Maps Foundation? #DatavizAndTools
Ecco le nuove funzionalità di intelligenza artificiale generativa di Photoshop