Google Musiclm: l’IA che crea musica partendo da un testo scritto
Forse è il caso di cominciare ad abituarsi all’idea di un futuro di “latta”, un futuro dove robotica e tecnologia artificiale non vogliono surclassare l’uomo – anzi tutt’altro – un futuro dove si collabora con essa e si lavora a pieno regime per migliorare la società.
Seguendo la scia dei modelli di machine learning, come DALL-E 2, Stable Diffusion o Midjourney, che generano immagini partendo da un testo scritto dall’utente, Google presenta al mercato MusicLM, un’IA capace di generare musica, anche cantata, partendo da un testo scritto.
“MusicLM genera musica a 24 kHz che rimane coerente per diversi minuti, così si legge nel paper firmato dai ricercatori Google. I nostri esperimenti mostrano che MusicLM supera i modelli precedenti sia in termini di qualità audio che di aderenza alla descrizione testuale”.
I modelli di intelligenza artificiale simili a MusicLM, che potremmo quindi presentare come le sue “versioni precedenti” seppur quasi contemporanee, sono Dance Diffusion, sviluppato anch’esso da Google; Riffusion, perfezionato dagli sviluppatori Seth Forsgren e Hayk Martiros, il quale consente di generare musica a partire da un’immagine, per la precisione da uno spettrogramma.
MusicLM, successiva e quindi con un quid in più, si basa su un set di dati – chiamato MusicCaps – che include 5.500 spezzoni musicali che Google ha rilasciato pubblicamente. È possibile ascoltarli qui.
Attualmente il codice di MusicLM non è pubblico, e i ricercatori di Google non prevedono di rilasciarlo per il momento. Analizzando il documento accademico di presentazione, qui consultabile e scaricabile in versione pdf, si nota come vengano evidenziati alcuni aspetti e il potenziale impatto negativo di una tecnologia di questo tipo: copyright e problemi di appropriazione culturale, quelli più evidenti.
Ci costerà attendere che vengano, quindi, attuati affinamenti, indicati come necessari dagli stessi ricercatori.
E se c’è qualcuno che sogna un mondo alla IoRobot, c’è chi giustamente esprime il suo dissenso, non verso l’IA in sé, ma verso la disumanizzazione dell’essere umano; tra questi vi è Nick Cave, cantautore australiano, che ha più volte espresso il suo “attrito” – a seguito di tentativi di creare “testi e canzoni che rispecchiassero Nick Cave” – nei confronti di ChatGPT, un prototipo di chatbot basato su intelligenza artificiale e machine learning, sviluppato da OpenAI, specializzato nella conversazione con un utente umano.
“Le canzoni nascono dalla sofferenza e gli algoritmi, per quanto ne so, non sono in grado di predire la complessa lotta umana per la creazione. I dati non soffrono. […] La malinconia del ruolo di ChatGPT è quella di essere destinato ad imitare un’esperienza umana che non potrà mai vivere, e non importa quanto la stessa esperienza umana verrà svalutata in futuro.” E ancora: “Ciò che rende una canzone una grande canzone non può richiamare qualcos’altro che già esiste. Scrivere una bella canzone non è fare una copia, una replica, o un pastiche, ma l’opposto. È un atto di distruzione di tutto ciò che è stato prodotto in passato.”
Chissà, ma è indiscusso l’imbrutimento dell’uomo. “Nostra culpa, l’uomo si raffredda più velocemente del pianeta su cui vive”, come disse, e probabilmente confermerebbe, Albert Einstein.
Antonietta Della Femina
Leggi anche: Pensati scienziata