Stabilitet AI har vært en nøkkelaktør innen kunstig intelligens (AI) bildegenerator, takket være dens åpen kildekode Stable Diffusion-modeller, som setter baren for kvalitet, tilpasning og hastighet. Nå legger selskapet til sin familie av modeller med sin mest avanserte tekst-til-bilde-generator til nå.
Onsdag lanserte Stability AI Stable Diffusion 3 Medium, som selskapet hevder er dets “mest sofistikerte” bildegenereringsmodell. Modellen med to milliarder parametere har flere oppgraderinger fra forgjengerne, noe som resulterer i generasjoner av høyere kvalitet.
Også: Slik bruker du Stable Diffusion AI til å lage fantastiske bilder
For eksempel kan den nye modellen overvinne typisk vanskelige oppgaver for bildegeneratorer, inkludert å generere fotorealistiske bilder (selv av hender og ansikter) og nøyaktig tekst uten artefakter eller stavefeil. Den kan også følge komplekse spørsmål og forstå romlige relasjoner, som vist på bildet nedenfor.
I følge selskapet er Stable Diffusion 3 Medium en mindre modell, noe som gjør den til en god kandidat for å kjøre på både individuelle datasystemer og GPUer på bedriftsnivå. Stabilitet AI la til at modellen også er ideell for tilpasning på grunn av dens evne til å samle «nyanserte detaljer fra små datasett."
Også: De beste AI-bildegeneratorene i 2024 : Testet og gjennomgått
Stable Diffusion 3 Mediums vekter forblir åpen kildekode og tilgjengelig for alle brukere med en gratis ikke-kommersiell lisens via Hugging Face. De som er interessert i å bruke den kommersielle modellen oppfordres til å kontakte Stability AI for lisensieringsinformasjon.
Stable Diffusion 3 Medium er tilgjengelig på Stability AIs API, Stable Assistant, selskapets chatbot, og Discord via Stable Artisan.