Preparati ad entrare in una nuova era nel settore musicale poiché Meta ha recentemente annunciato il lancio di MusicGen, un generatore di musica basato sull’Intelligenza Artificiale che promette di rivoluzionare il modo in cui creiamo e consumiamo musica.
Questo annuncio arriva sulla scia di un’intensa concorrenza nello spazio di generazione musicale AI e l’offerta di Meta si distingue come un concorrente impressionante.
Ecco come Twitter.com/FelixKreuk” data-wpel-link=”external” target=”_blank” rel=”nofollow external noopener noreferrer”>Felix Creuk spiega Meta MusicGen su Twitter:
Vi presentiamo MusicGen: un modello di generazione musicale semplice e controllabile. MusicGen può essere richiesto sia dal testo che dalla melodia.
Rilasciamo codice (MIT) e modelli (CC-BY NC) per la ricerca aperta, la riproducibilità e per la comunità musicale: pic.twitter.com/h1l4LGzYgf— Felix Kreuk (@FelixKreuk) 9 giugno 2023
Cos’è MetaMusicGen?
Meta MusicGen, costruito sulla base di un potente modello Transformer, segue le orme di modelli linguistici come ChatGPT, impiegando una Tecnologia AI all’avanguardia per prevedere e generare segmenti musicali. Proprio come un modello linguistico anticipa le lettere successive in una frase, MusicGen prevede il prossimo segmento musicale basato su un dato brano musicale.
Per realizzare questa impresa, i ricercatori di Meta utilizzano il tokenizer audio EnCodec, che seziona i dati audio in unità più piccole per un’elaborazione efficiente. La genialità di MusicGen risiede nella sua capacità di gestire simultaneamente descrizioni testuali e segnali musicali, risultando in una perfetta fusione di espressione artistica.
La formazione MusicGen ha comportato l’utilizzo di un vasto dataset costituito da 20.000 ore di musica autorizzata. Il team ha sfruttato una raccolta interna di 10.000 registrazioni audio di alta qualità, integrate da dati musicali provenienti da fonti affidabili come Shutterstock e Pond5. Questo meticoloso processo di formazione assicura che MusicGen possieda l’abilità di creare musica che risuoni con gli ascoltatori.
Generazione musicale al suo meglio
Mentre vari modelli di intelligenza artificiale si sono distinti nella generazione di testo, sintesi vocale e creazione visiva, la generazione di musica di alta qualità è rimasta relativamente scarsa. Le composizioni intricate della musica, gli strumenti sovrapposti e la necessità di catturare l’intero spettro di frequenze pongono sfide significative.
Tuttavia, MusicGen affronta questi ostacoli frontalmente, aprendo la strada a un’esperienza musicale senza precedenti.
Come usare Meta MusicGen?
Gli utenti desiderosi di esplorare le funzionalità di MusicGen possono accedervi tramite l’API Hugging Face. Tuttavia, a seconda del carico di utenti simultanei, il processo di generazione della musica potrebbe richiedere del tempo. In alternativa, per risultati più rapidi, gli utenti hanno la possibilità di impostare la propria istanza del modello tramite il file Sito web di Hugging Face utilizzando questo collegamento.
Coloro che sono esperti nella codifica possono persino scaricare il codice ed eseguirlo manualmente per un approccio più pratico.
Usare MusicGen è un processo semplice. Ecco come farlo:
- Visita il sito web di Hugging Face
- Clicca su “Spazi” situato nell’angolo in alto a destra
- Cerca “MusicGen” nella casella di ricerca fornita
- Cerca la versione pubblicata da Facebook
- Inserisci il prompt desiderato nella casella a sinistra
- Clicca su “Genera”
Come funziona Meta MusicGen?
Con MusicGen, la tua descrizione diventa il catalizzatore per la creazione di un segmento audio di 12 secondi. Per coloro che cercano un tocco più personalizzato, il modello consente anche l’inclusione di un file audio di riferimento, che funge da base per una melodia complessa. Combinando la descrizione e la melodia fornita, MusicGen si sforza di produrre musica che risuoni veramente con le preferenze dell’utente.
In un confronto testa a testa, MusicGen supera i suoi concorrenti, tra cui Google MusicLM, Riffusion e Musai. I ricercatori dimostrano l’output superiore di MusicGen mostrando un sito Web di esempio con questi modelli.
MusicGen offre quattro diverse dimensioni di modello, che vanno dai compatti 300 milioni di parametri ai robusti 3,3 miliardi di parametri, sbloccando il potenziale per composizioni complesse e affascinanti. Per utilizzare i modelli in locale, si consiglia di utilizzare una GPU con almeno 16 GB di RAM.
La visione di Meta per il Metaverso
MusicGen rappresenta solo uno dei tanti modi in cui Meta utilizza l’intelligenza artificiale per creare esperienze coinvolgenti e accattivanti per i suoi utenti. Mentre Meta continua a costruire verso la realizzazione di un mondo virtuale condiviso chiamato metaverso, dove le persone possono interagire, collaborare e divertirsi su più piattaforme e dispositivi, MusicGen è pronto a infondere nel metaverso un nuovo senso di intrattenimento e incanto musicale.