AudioCraft vuole rivoluzionare la musica come i sintetizzatori negli anni Settanta #DatavizAndTools

Secondo quanto rivela il Financial Times, sono in corso colloqui tra Google e Universal che puntano a una vera e propria partnership sul versante dell’Ai per affrontare il dilagante uso dei deepfake nel mondo della musica. Parliamo della tecnologia che utilizza l’intelligenza artificiale per creare repliche realistiche di contenuti autentici. Declinato nell’ambito musicale l’algoritmo imita in modo convincente voce, testi e sound di artisti affermati, generando così brani o contenuti audio quasi sempre senza il loro consenso. L’obiettivo di questa alleanza, come scrive il Sole 24 Ore, sarebbe proprio sviluppare uno strumento che consenta ai fan di creare legittimamente questi brani e pagare diritto d’autore e diritti connessi ai detentori.

Da alcuni mesi esistono esperimenti di text-to music come abbiamo raccontato in questo Blog. Google ha ideato MusicLM , un modello linguistico di grandi dimensioni che ha generato minuti di suoni basati su prompt di testo ed è accessibile solo ai ricercatori. Settimana scorsa Meta ha lanciato la piattaforma AudioCraft. Si tratta di una intelligenza generativa open source che crea audio dal testo.

Come funziona?

Si struttura in tre modelli di intelligenza artificiale generativa. AudioGen e MusicGen si occupano di tradurre in suoni il testo. Per essere più precisi il primo è un generatore di rumori e suoni come i versi degli animali, il frastuono della città o l’impatto di materiali diversi tra loro. MusicGen invece si occupa invece di musica e si è addestrato su oltre 20mila ore di canzoni e file audio. EnCodec, invece comprime i suoni per produrre audio di qualità migliore. Secondo Meta, un musicista potrebbe realizzare musica da zero semplicemente utilizzando questi tre software. Come ogni altro chatbot che si rispetti, basterà inserire solo alcune indicazioni testuali per avere i primi esempi sonori. L’obiettivo è che possa diventare un nuovo tipo di strumento, come avvenuto con i sintetizzatori oltre 60 anni fa. Ultima cosa: sotto il profilo del copyrigh non ci dovrebbero essere problemi perché Meta dichiara di avere i diritti di propietà e le licenze di tutte le 20.000 ore di musica su cui si è allenato il suo algoritmo.

Per approfondire.

Cosa è e come funziona Code Interpreter per Gpt-4?

Come riconoscere immagini e testi generati dall’AI?

La matematica della ricchezza, la disuguaglianza inevitabile e l’econofisica

Wikipedia, l’intelligenza collettiva e gli affari #datavizandtool

Da Harry Potter mafioso agli ultimi videogiochi ripensati a 8 bit. L’Ai generativa continua a divertire #datavizandtools

Come si costruisce una mappa di Milano con ChatGpt? #datavizandtools

Come funziona MusicGen, il ChatGpt della musica di Meta #DatavizandTools

Bing, come funziona il copilota di Microsoft per il web? #DatavizAndTools

Le ultime novità “audio” dell’Ai generativa #DatavizAndTools

Gpt-4 vs Bard, cinque domande: chi risponde meglio? #howmeasuring

A proposito di mappe, cosa è Overture Maps Foundation? #DatavizAndTools