Hva er Veo? Møt Googles neste generasjons AI-videoskaper, drevet av Imagen 3

0
17
Veltolav Skjermbilde av Sabrina Ortiz/ZDNET

AI-bildegeneratorer var på topp i 2023, men nå flytter selskaper fokus til neste grense – AI-videogenerering. Da OpenAI avduket sin AI tekst-til-video-generator, Sora, i februar 2024, var det bare et spørsmål om tid før Google gjorde det samme. 

På tirsdag, på sin årlige Google I/O-utviklerkonferanse, avduket Google Veo, den mest avanserte tekst-til-video-generatoren, som er i stand til å generere videoer med 1080p-oppløsning som er over ett minutt lange.

I tillegg til den høye kvaliteten, sier Google at Veo gir brukerne et “enestående nivå av kreativ kontroll.” AI-generatorens dypere forståelse av naturlig språk gjør det mulig for Veo å levere flere detaljer fra lengre spørsmål og å forstå filmatiske termer som “timelapse” eller "luftbilder."  

Også: Alt annonsert under Google I/O 2024: Gemini, Search, Android 15 og mer

I tillegg kan videogeneratoren takle et vanlig problem med videogenerering – flytende opptak. Ifølge Google kan Veo lage konsistente opptak, med forskjellige motiver som mennesker, dyr og objekter som beveger seg realistisk i bildene. 

Google er ikke nytt for videogenerering. Selskapet bemerket at denne modellen bygger på alle tidligere videogenererende prosjekter, inkludert Imagen-Video, VideoPoet og Lumiere.

Som OpenAIs Sora, er ikke Googles Veo tilgjengelig for offentligheten ennå. Snarere deler Google Veo først med utvalgte skapere i en privat forhåndsvisning i VideoFX. Google inviterer deg imidlertid til å bli med på en venteliste for å prøve modellen til slutt.

I tillegg avduket Google Imagen 3, dens høyeste kvalitet tekst-til-bilde-modellen til dags dato. Imagen 3, som kan skryte av forbedret bildekvalitet og færre visuelle artefakter, er også begrenset til en privat forhåndsvisning inne i ImageFX for utvalgte skapere og har sin egen venteliste.