LG AI Research permette a qualsiasi utente di creare musica scegliendo i parametri da cambiare.
Un gruppo di scienziati, del centro di ricerca sull’Intelligenza Artificiale della multinazionale LG, ha proposto un sistema per interagire con l’AI e produrre brani audio partendo da basi grezze, personalizzabili. Il controllo dei modelli generativi è un fattore importante nella gestione dell’intero processo.
Mentre MIDI offre un protocollo definito con strumenti standard ed informazioni temporali sulle note, manca una disponibilità consolidata di dataset MIDI per coppie multimodali. Per superare questo limite, sono stati utilizzati metadati come condizioni generative, estraibili senza alcuno sforzo umano.
A differenza di lavori precedenti in cui gli utenti dovevano agire su tutti gli input, è stata migliorata la capacità del modello di adattarsi a condizioni variabili, garantendo flessibilità.
Nel lavoro pubblicato nell’archivio scientifico arxiv.org, è presentata la demo che genera sequenze MIDI multitraccia.
Il primo autore della ricerca Sangjun Han, insieme ai colleghi, ha realizzato una semplice interfaccia accessibile ad esperti ed utenti base. Come si vede nel relativo video, nella barra laterale, si specificano gli strumenti da impiegare ed il tempo. Dopo la generazione si possono modificare le tracce nel pannello centrale, ad esempio rimuovendo o aggiungendo strumenti o regolando il momento in cui questi iniziano a suonare.
Con l’aiuto della strategia di addestramento, non è richiesto che gli utenti completino tutte le proprietà, contemplando l’uso di opzioni predefinite vuote.
In pratica, l’autoregressività significa che ogni nuovo token musicale, come note e dinamica, venga generato sulla base di quelli originati precedentemente. Durante l’addestramento vengono rimosse casualmente alcune informazioni (token) per permettere un controllo flessibile.
La dimostrazione contribuisce a fornire motivi che fungono da tema centrale della narrazione, rivelandosi superiore rispetto ad altri modelli.
RIPRODUZIONE RISERVATA – © 2024 SHOWTECHIES – Quando la Tecnologia è spettacolo™ – E’ vietata la riproduzione e redistribuzione, anche parziale, dell’articolo senza autorizzazione scritta. Se desideri riprodurre i contenuti pubblicati, contattaci.
Snapshot: LG AI Research
Commenta per primo