
AI-bilde generatorer var på topp i 2023, men nå flytter selskaper fokus til neste grense – AI-videogenerasjon. Da OpenAI avduket sin AI tekst-til-video-generator, Sora, i februar 2024, var det bare et spørsmål om tid før Google gjorde det samme.
På tirsdag, på sin årlige Google I/O-utviklerkonferanse, avduket Google Veo, den mest avanserte tekst-til-video-generatoren, som er i stand til å generere videoer med 1080p-oppløsning som er over ett minutt lange.
I tillegg til høykvalitetsresultatet, sier Google at Veo gir brukerne et “enestående nivå av kreativ kontroll”. AI-generatorens dypere forståelse av naturlig språk gjør at Veo kan levere flere detaljer fra lengre spørsmål og å forstå filmatiske termer som “timelapse” eller "luftbilder."
Også: Alt annonsert under Google I/O 2024: Gemini, Search, Android 15 og mer
I tillegg kan videogeneratoren takle et vanlig problem med videogenerering – flytende opptak. Ifølge Google kan Veo lage konsekvente opptak, med forskjellige motiver som mennesker, dyr og objekter som beveger seg realistisk i bildene.
Google er ikke nytt for videogenerering. Selskapet bemerket at denne modellen bygger på alle tidligere videogenererende prosjekter, inkludert Imagen-Video, VideoPoet og Lumiere.
Som OpenAIs Sora, er ikke Googles Veo tilgjengelig for offentligheten ennå. Snarere deler Google Veo først med utvalgte skapere i en privat forhåndsvisning i VideoFX. Google inviterer deg imidlertid til å bli med på en venteliste for å prøve modellen til slutt.
I tillegg avduket Google Imagen 3, dens høyeste kvalitet tekst-til-bilde-modellen til dags dato. Imagen 3, som har forbedret bildekvalitet og færre visuelle artefakter, er også begrenset til en privat forhåndsvisning inne i ImageFX for utvalgte skapere og har sin egen venteliste.