Møt Veo, Googles mest avanserte tekst-til-video-generator, avduket på Google I/O 2024

0
48
Veltolav Skjermbilde av Sabrina Ortiz/ZDNET

AI mage-generatorer var alle mani i fjor, men nå flytter selskaper fokus til neste grense – AI-videogenerasjon. Da OpenAI lanserte sin AI-tekst-til-video-generator, Sora, tidligere i år, var det på tide for Google å lansere sin egen – og selskapet leverte. 

Tirsdag, kl. Googles årlige Google I/O-utviklerkonferanse avslørte Google Veo, dens mest avanserte tekst-til-video-generator, som er i stand til å generere videoer med 1080p-oppløsning som er over ett minutt lange. 

Også: Alt annonsert under Google I/O 2024: Gemini, Search, Android 15 og mer

I tillegg til den høye kvaliteten på utdataene, sa Google, tilbyr Veo brukere med et "enestående nivå av kreativ kontroll." AI-generatorens dypere forståelse av naturlig språk gjør at Veo kan levere flere detaljer fra lengre spørsmål og å forstå filmatiske termer som “timelapse” eller "luftbilder."

I tillegg kan videogeneratoren takle et vanlig problem med videogenerering – flytende opptak. Ifølge Google kan Veo lage konsistente opptak, med forskjellige motiver som mennesker, dyr og objekter som beveger seg realistisk i bildene. 

Google er ikke nytt for videogenerering: Selskapet erkjente at denne modellen bygger på alle selskapets tidligere videogenererende prosjekter, inkludert Imagen-Video, VideoPoet og Lumiere. 

Som OpenAIs Sora, Googles Veo er ikke tilgjengelig for publikum ennå. Snarere deles Veo først med et utvalgt antall skapere i en privat forhåndsvisning i VideoFX. Publikum inviteres imidlertid til å melde seg på en venteliste hvis de er interessert i å prøve modellen selv. 

I tillegg avduket Google Imagen 3, sin tekst-til-bilde-modell av høyeste kvalitet. Dato. Modellen, som har forbedret bildekvalitet og færre visuelle artefakter, vil også være begrenset til en privat forhåndsvisning inne i ImageFX for utvalgte skapere og en venteliste for publikum.