Stability AI lanserer sitt 'mest sofistikerte' bildegenerator ennå

0
22
Getty Images/NurPhoto/Contributor

Stabilitet AI har vært en nøkkelaktør innen kunstig intelligens (AI) bildegenerator, takket være dens åpen kildekode Stable Diffusion-modeller, som setter baren for kvalitet, tilpasning og hastighet. Nå legger selskapet til sin familie av modeller med sin mest avanserte tekst-til-bilde-generator til nå. 

Onsdag lanserte Stability AI Stable Diffusion 3 Medium, som selskapet hevder er dets “mest sofistikerte” bildegenereringsmodell. Modellen med to milliarder parametere har flere oppgraderinger fra forgjengerne, noe som resulterer i generasjoner av høyere kvalitet. 

Også: Slik bruker du Stable Diffusion AI til å lage fantastiske bilder

For eksempel kan den nye modellen overvinne typisk vanskelige oppgaver for bildegeneratorer, inkludert å generere fotorealistiske bilder (selv av hender og ansikter) og nøyaktig tekst uten artefakter eller stavefeil. Den kan også følge komplekse spørsmål og forstå romlige relasjoner, som vist på bildet nedenfor. 

Stabilitetsdiffusjon 3 Medium Stability AI

I følge selskapet er Stable Diffusion 3 Medium en mindre modell, noe som gjør den til en god kandidat for å kjøre på både individuelle datasystemer og GPUer på bedriftsnivå. Stabilitet AI la til at modellen også er ideell for tilpasning på grunn av dens evne til å samle «nyanserte detaljer fra små datasett." 

Også: De beste AI-bildegeneratorene i 2024 : Testet og gjennomgått

Stable Diffusion 3 Mediums vekter forblir åpen kildekode og tilgjengelig for alle brukere med en gratis ikke-kommersiell lisens via Hugging Face. De som er interessert i å bruke den kommersielle modellen oppfordres til å kontakte Stability AI for lisensieringsinformasjon. 

Stable Diffusion 3 Medium er tilgjengelig på Stability AIs API, Stable Assistant, selskapets chatbot, og Discord via Stable Artisan.