Google avduker en rekke Vertex AI-oppgraderinger for bedre å imøtekomme bedriftskunder

0
30
Geminilow Skjermbilde av Sabrina Ortiz/ZDNET

Mens Google er mest kjent for sin forbrukervendte Gemini chatbot, tilbyr den også løsninger for bedrifter gjennom sin bedriftsklare AI-plattform, Vertex AI. På torsdag kunngjorde Google at Vertex AI får nye modeller og oppdateringer.

For det første har Google gjort svært etterlengtede endringer i sine interne modeller, inkludert flytting av Gemini 1.5 Flash fra offentlig forhåndsvisning til generell tilgjengelighet. Gemini 1.5 Flash, annonsert forrige måned på Google I/O, er den raskeste Gemini-modellen i Googles API og et mer kostnadseffektivt alternativ til Gemini 1.5 Pro. Til tross for den lave ventetiden er Gemini 1.5 Flash en svært konkurransedyktig modell med et kontekstvindu på 1 million token.

Også: Gmail-brukere kan nå be Googles Gemini AI om å hjelp med å skrive og oppsummere e-poster

Google sammenlignet til og med modellens ytelse med OpenAIs GPT-3.5 Turbo, og fremhever hvordan Gemini 1.5 Flash har et symbolvindu som er omtrent 60 ganger større, 40 % raskere i gjennomsnitt når det gis en input på 10 000 tegn, og har en oppgang til fire ganger lavere input på pris, med kontekstbufring aktivert for innganger større enn 32 000 tegn.

Google oppdaterte også Gemini 1.5 Pro, den generelle modellen med best ytelse som selskapet annonserte på Google I/O. Modellen vil nå være tilgjengelig i Vertex AI med et kontekstvindu på 2 millioner token, som dobler størrelsen på forrige kontekstvindu, slik at den kan behandle to timer med video, 22 timer med lyd, over 60 000 kodelinjer og over 1,5 millioner ord.

Også:Hva betyr et langt kontekstvindu for en AI-modell, som Gemini?

Deretter lanserte Google Imagen 3, den nyeste grunnmodellen for bildegenerering, som forhåndsvisning for Vertex AI-kunder. Noen høydepunkter i denne modellen inkluderer 40 % raskere generering, fotorealistisk generering av grupper av mennesker, bedre prompt-troskap, flerspråklig støtte og innebygde sikkerhetsfunksjoner, ifølge Google.

I tillegg til å oppdatere modellene sine, legger Google til flere tredjeparts og åpne modeller, inkludert Gemma 2, tilgjengelig nå, og Mistral, som kommer til sommeren.

Siden har holdt kostnadene så lave som mulig er en prioritet for bedrifter, Google ruller også ut kontekstbufring i offentlig forhåndsvisning i Gemini 1.5 Pro og Gemini 1.5 Flash. Denne tilnærmingen vil forbedre hvordan brukere mater modellkonteksten og bør som et resultat redusere kostnadene. I tillegg bør den nye tilrettelagte gjennomstrømningsfunksjonen, generelt tilgjengelig i dag, hjelpe kundene med å skalere bruken av Googles førstepartsmodeller.

For å håndtere generativ feilinformasjon og hallusinasjonsproblemer planlegger Google å introdusere jording med tredjepartsdata, kommende kvartal, for å hjelpe bedrifter med å innlemme dataene sine i sine generative AI-agenter.

Også:&# xA0;Google støtter disse 20 oppstartene for å bidra til å forbedre verden med AI

Google annonserte også et annet jordingsalternativ: jording med høy kvalitet bruker kun den angitte konteksten for å generere et svar, og gjør det ikke' t faktor i modellens verdenskunnskap for å sikre høye nivåer av fakta. Jording med høy kvalitet er tilgjengelig i en eksperimentell forhåndsvisning og drevet av en finjustert versjon av Gemini 1.5 Flash.

For å gi bedrifter mer kontroll over hvor dataene deres lagres og behandles, har Google dataresidency for data lagret i hvile i 23 land og planlegger å utvide ML-behandlingsforpliktelsene til åtte flere.

Hvis bedriften din er interessert i å lære mer om å komme i gang med Vertex AI, kan du besøke denne Google Cloud-nettsiden.

p>