Nylig har det vært en strøm av nye AI-tekst-til-lyd-applikasjoner som ligner på bølgen av AI-chatboter som dukket opp etter ChatGPT ble utgitt. For å følge med på trenden har tidligere Google Deepmind-forskere lansert en AI-musikkgenerator kalt Udio.
Også: Å generere musikk ved hjelp av AI i Copilot ble akkurat enda bedre< /p>
På onsdag, etter måneder i lukket beta, flyttet Udio til en offentlig lansering, noe som gjorde det mulig for alle å få tilgang til den nye musikkgeneratoren fra Udio-nettstedet gratis.
Med Udio kan du lage en sang fra en tekstmelding og tilpasse alle sangens elementer — inkludert lengden, vokalen, teksten , og mer.
Til tross for de mange AI-musikkgeneratorene som nå er tilgjengelige på markedet – slik som Googles MusicFX, Stability AI’s Stable Audio og Suno AI – hevder Udio at musikkgeneratoren kan oppnå bedre resultater.
"Det er ingenting tilgjengelig som er i nærheten av brukervennligheten, stemmekvaliteten og musikaliteten til det vi har oppnådd med Udio — det er et ekte vitnesbyrd om folkene vi har involvert," ; sa David Ding, medgründer og administrerende direktør i Udio.
Etter å ha testet mange AI-musikkgeneratorer, satte jeg Udio på prøve for å se om disse påstandene er berettiget.
Det er enkelt å komme i gang: Logg på, skriv inn en beskrivelse i tekstboksen til sangen du vil ha generert, velg om du vil at sangen skal være instrumental eller ha tekst (som kan være din egen eller AI automatisk generert av AI) , og vent på at sangen skal genereres.
Også: Hva er Suno? 'ChatGPT for musikk' genererer sanger på sekunder
Inspirert av lunsjen min skrev jeg inn følgende melding i Udio, "Lag en sang om gleden ved lunsjtid med et morsomt EDM-beat."  ;
Udio-nettstedet hevder at det tar mindre enn 40 sekunder å generere en sang; Men etter min erfaring tok det mye lengre tid, totalt åtte minutter. Da jeg kontaktet Udio-teamet om det, sa de at lengre ventetid enn vanlig skyldtes "skredet" av interesse, men at teamet jobber med å få det fikset snart.
Når det gjelder resultatene, ga Udio ut to versjoner av forespørselen min, hver 33 sekunder lang. Sangbitene var imponerende, og hørtes ut som om de var produsert profesjonelt og med alle elementene i en sang til stede – som du kan høre nedenfor.
Jeg fikk muligheten til å utvide sangen ytterligere ved å legge til en utvidelse før eller etter klippet som en seksjon, intro eller outro. Jeg valgte å legge til en annen seksjon. Etter å ha ventet i 20 minutter og ingenting dukket opp, ga jeg imidlertid opp å vente.
Også: Stability AIs nye lydmodell lager enda lengre sanger – her er hvordan du prøv det gratis
Med tanke på at de lange ventetidene sannsynligvis er et serverproblem på grunn av uventet, høy etterspørsel på lanseringsdagen, og sannsynligvis en uteligger i opplevelsen, vil jeg utelate modellens hastighet i min første evaluering.
Kvaliteten på den genererte musikken virker lovende og hørtes fyldigere og rikere ut enn andre modeller jeg har brukt før. Det var enkelt å komme i gang og inkluderte flere personaliseringsalternativer enn andre jeg har brukt. Når modellen er oppe og går, går vi hands-on igjen for å se hvordan den er sammenlignet med andre modeller, med tanke på hastigheten.