Stability AIs nye lydmodell lager enda lengre sanger – her er hvordan du kan prøve det gratis

0
12
Stabil lyd 2.0 Sabrina Ortiz/ZDNET

Det har vært utbredt industrifokus i det siste på lydgenerative AI-modeller, med OpenAI som denne uken lanserer de siste oppdateringene av sin egen modell, Voice Engine. Nå blir Stability AI med på trenden, som har avslørt sin egen mest avanserte lydmodell.

Også: DALL-E legger til en ny måte å justere AI-genererte bilder. Lær hvordan du bruker den

På onsdag avduket Stability AI — åpen kildekode AI-selskapet som er best kjent for sin stabile diffusjonsmodell – Stable Audio 2. Denne nye modellen tilbyr betydelige oppgraderinger i forhold til forgjengeren – Stable Audio 1.0 – utover tekst-til-lyd-funksjoner. 

Stable Audio 2 har lyd-til-lyd-funksjoner, som gjør det mulig for brukere å laste opp lydprøver og lage et bredt spekter av lyder ved hjelp av naturlige språkoppfordringer. Med stiloverføring kan du endre generert eller opplastet lyd for å tilpasse seg en bestemt stil og tone. 

Også: Copilot i Microsoft 365 legger til nye AI-fordeler og her&apos ;s hvordan du får tak i dem

For å beskytte kreativ integritet og artister' rettigheter, må opplastingene være fri for opphavsrettsbeskyttet materiale. Selskapet bruker innholdsgjenkjenningsteknologi fra Audible Magic for å forhindre slike overtredelser og sikre at brukerne er kompatible. 

For ytterligere å beskytte artister ble Stable Audio 1.0 og Stable Audio 2.0 trent på data fra AudioSparx, som består av mer enn 800 000 lydfiler, og hvis artister fikk muligheten til å velge bort opplæringen i Stable Audio-modellen. 

Den nye modellen kan også produsere spor på opptil tre minutter med 44,1 kHz stereo, en betydelig oppgradering i forhold til Stable Audio som bare kunne produsere spor på opptil 45 sekunder. Den tre minutter lange generasjonen inkluderer alle elementene som trengs i en sang, som melodier, backingspor, lydeffekter og mer. 

Også: Fra Billie Eilish til Stevie Wonder, musikere fordømmer AIs “angrep på menneskelig kreativitet”

Modellen er allerede offentlig tilgjengelig for gratis bruk på Stable Audio-nettstedet. Det er enkelt å komme i gang: Besøk nettstedet, logg på med din stabile AI- eller Google-konto, og begynn å fikle.