Attualmente è uno dei modelli linguistici open source made in China più potenti, ha capacità di “ragionamento” avanzate e costa meno degli altri. Qui trovate una analisi. Quello che lo rende diverso è che è in grado di competere con i modelli di reasoning più avanzati di OpenAI. Non solo. Il loro modello più potente, DeepSeek V3, presentato a dicembre, è un LLM (modello linguistico di grandi ) da 67 miliardi di parametri. Non è gigante: GPT-4, quello di OpenAI, dovrebbe avere superato i 100 trilioni di parametri. Se leggete il suo paper scientifico, scoprite però che per realizzarlo ci hanno speso poco meno di 6 milioni di dollari, almeno un decimo di quanto sarebbe costato GPT-4.
Inoltre, è stato addestrato in solo due mesi e con risorse di calcolo inferiori a quelle utilizzate da Meta e OpenAI. La settimana scorsa è stato rilasciato DeepSeek-R1 Zero. Si confronta con o1 di OpenAI oppure con il nuovo Gemini 2.0 Flash Thinking Experimental di Google, perché simula una catena di pensieri. Detta più semplicemente, riflette prima di rispondere, simulando così il ragionamento di un essere umano.
Il motivo che ha messo in allarme mezza Silicon Valley è che ha superato, almeno così sostengono loro, o1 di OpenAI in diversi benchmark e test, tra cui il test di ragionamento matematico (AIME) e quello sul coding, cioè SWE-bench Verified. Lo proviamo oggi in diretta per voi. Siete su Ascanio.
Cosa è Ascanio? E’ un format video di Info Data dove si discute a ruota libera di giornalismo, attualità e dati rigorosamente senza una scaletta. Buona visione.
Le altre puntate di Ascanio
La ricerca approfondita di Deep Research è qualcosa di nuovo #Ascanio
Impariamo a geolocalizzare i dataset con Claude. #Ascanio
Pinpoint, ChatGpt Pro e il calendario dell’avvento di OpenAi #Ascanio
Claude 3, le mappe elettorali e l’analisi dei dati
Cosa ha capito SearchGpt delle elezioni Usa e della vittoria di Trump? #Ascanio
Come parla ChatGpt? E come disegna Imagen3? La nostra prova #Ascanio
OpenAi Canvas, i video generativi di Meta e l’evoluzione di Copilot #Ascanio
OpenAi for profit, la scelta di Mira Murati e i podcast generativi. Lezioni di Ai Gen #25
Gli Ai Phone, le promesse generative e iPhone 16 #Ascanio
Sora Luma e V2A e i video realizzati dai modelli di Ai (sempre più realistici) #Ascanio
L’Intelligenza Artificiale Generale, la sicurezza di OpenAi e il Seo segreto di Google Lezione 22
La prova di Gpt-4o, Project Astra e alcune considerazioni. #Ascanio