Diciamo che c’è un prima e un dopo DeepSeek. E anche se non abbiamo ancora chiaro l’impatto dei chatbot low cost cinesi sul business delle aziende occidentali come anche non abbiamo chiarissimo la gestione della privacy e della sicurezza, oramai abbiamo capito che ogni annuncio del Continente Rosso diventa subito virale. Manus è stato subito salutato come il DeepSeek degli agenti Ai, un software che sta già “cambiando tutto” in Cina e che quindi quindi è destinato a “spaccare” il mercato. Sui social trovate di tutto, dallo stupore, alla sorpresa. C’è chi è pronto a scommettere che cambierà tutto, chi celebra il funerale delle Big Tech occidentali e chi è si dice già pronto a diventare miliardario affidando il proprio business a Manus. In realtà sappiamo tutti che a differenza di DeepSeek che era accessibile (e scaricabile) di Manus sappiamo ancora pochissimo. Ed è un problema.
Qui sotto uno dei video che trovate sul video. In questo l’agente cinese analizza la situazione in Borsa di Tesla.
Da quanto si apprende sul sito è stato sviluppato da Butterfly Effect una startup fondata da Xiao Hong, laureato nel 2015 alla Huazhong University of Science and Technology. Monica ha ricevuto investimenti da Tencent e ZhenFund, raggiungendo una valutazione di circa 100 milioni di dollari alla fine del 2024. La società ha sede a Wuhan, Cina.
Tecnicamente è un Ai Agent e quindi è in grado di agire autonomamente, pianificando ed eseguendo operazioni complesse senza bisogno di supervisione costante. Qui sotto – ma è sempre un video preso dal sito – organizza una vacanza in Giappone di sette giorni.
Si basa su modelli Ai già esistenti, come Claude di Anthropic e Qwen di Alibaba. Quindi non è un LLM ma un sistema che usa LLM esistenti.
Tecnicamente Manus, si legge sempre nel sito, supererebbe Deep research di OpenAi in base al benchmark GAIA. Gaia sta per General AI Agent Benchmark. Può essere definito come un test standardizzato progettato per valutare e confrontare le capacità generali degli agenti di intelligenza artificiale. Questo tipo di benchmark mira a misurare non solo singoli aspetti come l’accuratezza o la velocità, ma anche la capacità degli agenti di pianificare, ragionare, adattarsi e risolvere problemi in ambienti diversi e complessi.
In altre parole, il benchmark GAIA verifica quanto un agente AI sia vicino al concetto di intelligenza artificiale generale (AGI), simulando situazioni che richiedono capacità cognitive trasversali e flessibilità, piuttosto che semplici compiti specifici.
I primi utenti che lo hanno usato però non sembrano essere di fronte a una Agi. Manus è in versione beta privata, accessibile solo su invito. I codici sono andati a ruba e non ci sono più. Ma puoi scrivergli su X e lui eseguirà un “task” per te.
Quello che insomma sappiamo per ora è poco. Ma quel poco è curiosamente diventato virale.