Jeg rangerte AI-funksjonene som ble annonsert på Google I/O fra mest nyttige til gimmicky

0
12

Google IO 2024 Kerry Wan/ZDNET

På sitt årlige utviklerarrangement, Google I/O, avduket Google mange nye AI-produkter, funksjoner og oppgraderinger. Hvor mange? AI ble nevnt 120 ganger i løpet av den to timer lange keynoten, som administrerende direktør Sundar Pichai ubeskjedent innrømmet ved slutten av den. Noen av disse nye tilbudene gir AI-løsninger på vanlige problemer, mens andre, selv om de er imponerende, neppe vil tilføre mye verdi til hverdagen vår. Ikke min, i hvert fall.

Også: 9 største kunngjøringer på Google I/O 2024: Gemini, Search, Project Astra og mer

For å hjelpe du sorterer gjennom alle kunngjøringene og identifiserer hvilke som kan ha en positiv innvirkning på hverdagen din, jeg har samlet det jeg fant som de mest imponerende AI-funksjonene, rangert fra mest sannsynlig å optimere hverdagen din til minst sannsynlig. 

1. Spør bilder

Denne funksjonen ble nevnt så kort under keynote at du lett kunne ha gått glipp av den. Ask Photos har imidlertid potensialet til å være til nytte for folk flest ved å introdusere en Gemini chatbot i Google Foto som kan hjelpe brukere med å sortere gjennom bildene sine. 

Også: Denne subtile (men nyttige) AI-funksjonen var min favoritt kunngjøring fra Google I/O 2024

Med Ask Photos-funksjonen kan brukere beskrive hvilke bilder eller innhold fra albumet de vil finne. Google Photos vil finne det for dem i kamerarullen deres, til og med pakke sammen flere bilder når det er nødvendig, som vist i demoen nedenfor. 

På I/O-scenen ga Google-sjef Sundar Pichai to eksempler som viste funksjonens nytte. I det første eksemplet spurte en bruker: "Hva er skiltnummeret mitt?" Deretter trakk Gemini nummeret ved å bruke kontekst for å identifisere hvilken bil som tilhørte brukeren. I den andre, en bruker som ønsket å se bilder av datterens fremgang som svømmer over tid, fikk Gemini automatisk til å pakke høydepunktene for seg ved å be den om det. 

Med beløpet av bilder vi tar og lagrer daglig, er denne typen hjelp til å sortere, organisere og pakke innhold svært nyttig. Google delte at funksjonen kommer til Google Foto senere i sommer og ertet til og med at flere funksjoner kommer.

2. Gmail Q&A-funksjon

Denne funksjonen ble også diskutert bare kort nær keynote-slutten, noe som gjør det lett å gå glipp av; men det løser et reell problem. Under Google Workspace-delen av keynote kunngjorde selskapet tre nye funksjoner som kommer til Gmail på mobil, inkludert Gmail Q&A0;

Som navnet tilsier, muliggjør Gmail Q&A-funksjonen brukere kan chatte med Gemini om konteksten til e-postene deres i Gmail-mobilappen, slik at de kan stille spesifikke spørsmål om innboksen sin. 

Også: 5 spennende Android-funksjoner Google nettopp annonserte på I/O 2024

For eksempel, under eksemplet som ble presentert på Google I/O-stadiet, ba brukeren Gemini om å sammenligne bud på reparasjon av taktekker etter pris og tilgjengelighet. Gemini kunne deretter hente informasjonen fra flere innbokser og vise den for brukeren, som vist på bildet nedenfor. 

Gmail Q&A with Gemini Google

På grunn av min arbeidslinje (og handlevanene mine), er innboksen min oversvømmet med e-poster daglig. Å ha et verktøy som kan svare på spørsmål om de mange innboksene mine på mobiltelefonen min er en gamechanger, og tar hjelpen fra e-post AI-oppsummerere til neste nivå. Funksjonen vil bli utgitt til Google Lab-brukere i slutten av juli, 

3. Prosjekt Astra/Gemini Live

Et av keynotens mest imponerende øyeblikk var da Google Deepmind spilte av videoen til Project Astra, som viste en AI-stemmeassistent som kan hjelpe med visuelle spørsmål ved å bruke brukerens kamera, som vist i videoen nedenfor.  

Project Astra er et prosjekt fra Google DeepMind ment å omforme fremtiden til AI-assistenter ved å gi stemmeassistenter bevissthet om brukerens miljø. Prosjektet blir infundert i Gemini Live, en mobilopplevelse der brukere kan ha samtaler med Gemini som inkluderer konteksten til omgivelsene. 

Også: Jeg demonstrerte Googles Project Astra og det føltes som fremtiden for generativ AI (inntil den ikke gjorde det)

I Gemini Live-opplevelsen kan brukere også velge mellom forskjellige naturlig klingende stemmer og avbryte dem midt i samtalen, gjør disse utvekslingene mer naturlige og intuitive. 

Selv om brukere ikke kan dra nytte av hele den multimodale opplevelsen av Gemini Live ennå, med Google som legger til hele opplevelsen senere i år, har denne teknologien potensial til å transformere taleassistentopplevelsen. Dette leder til mitt neste punkt. 

4. Google Assistant: nedgradert, ikke død

Under arrangementet slapp Google på lur at Gemini snart kunne erstatte Google Assistant som standard AI-assistent på Android-telefoner. Til tross for Googles subtile omtale, er dette en stor avtale fordi det vil påvirke Android-kunder utover Pixel-brukerbasen og hvordan de samhandler med taleassistentene deres.

Google Pixel 8a Gemini Kerry Wan/ZDNET

Endringen er også betydelig fordi den bør forbedre kvaliteten på bistanden, ettersom Gemini er i stand til avansert språkbehandling. Planene for Gemini ser lovende ut, med Google som deler at AI til slutt vil bli overlappet på tvers av ulike tjenester og apper, og gir multimodal og skjermstøtte når det blir bedt om det.

5. Gemini avansert oppgradering til Gemini 1.5 Pro

Google lanserte først Geminis premium abonnementsnivå – Gemini Advanced – i februar, og ga brukere tilgang til Googles nyeste AI-modeller og lengre samtaler. Hos Google I/O forsterket selskapet tilbudene ytterligere, med en av de største oppgraderingene er tilgang til Gemini 1.5 Pro. 

Gemini 1.5 Pro gir publikum et kontekstvindu på 1 million tokens. For å sette dette tallet i perspektiv, kan brukere nå laste opp dokumenter på opptil 1500 sider, 100 e-poster eller 96 Cheesecake Factory-menyer, som Pichai nevnte på scenen. Google hevder at det er det største kontekstvinduet for en allment tilgjengelig chatbot for forbrukere.

Også: Hva betyr det å ha et langt kontekstvindu for en AI-modell?< /p>

Selv om jeg ikke tror en gjennomsnittlig bruker trenger denne typen vindu, hvis du tilfeldigvis er en superbruker som trenger hjelp med store mengder data, er dette ekstra kontekstvinduet en spillskifter. Interesserte brukere kan få tilgang til Gemini Advanced gjennom  Google One AI Premium-planen, som koster $20 månedlig når prøveperioden utløper. 

6. Veo og Imagen 3 

På Google I/O lanserte Google sin mest avanserte AI tekst-til-bilde-generator, Imagen 3, og tekst-til-video-generator, Veo. Begge tilbyr betydelige oppgraderinger fra sine forgjengere, med utdata av høyere kvalitet og høyere troverdighet til brukere. spør. Modellene forhåndsvises med utvalgte skapere; For å få tilgang til en av disse modellene, må interesserte brukere registrere seg på en venteliste. 

Selv om begge modellene ser ekstremt lovende ut og driver fremover AI  bilde- og videogenerering, grunnen til at de er rangert nederst på listen er at de ikke ser ut til å tilføre mye verdi til folks hverdag eller arbeidsflyt — med mindre du er en kreativ profesjonell som jobber med video- og bildegenerering hver gang. dag. For ikke-kreative er det et kult verktøy å ha i baklommen når muligheten byr seg. 

7. AI Overviews in Google Search 

Sist opp er AI Overviews-funksjonen i Google Search. Jeg plasserte AI-oversikter nederst på listen fordi selv om noen kanskje synes den AI-genererte innsikten øverst i søkeresultatene var nyttig, var det ikke noe reelt behov for å skyve den til alle amerikanske engelskbaserte søkere ettersom den bredere utrullingen ser ut til å løse et problem som ikke var der til å begynne med. 

Også: De 4 største Google Search-funksjonene annonsert på Google I/O 2024< /strong>

Systemet Google tilbød før du måtte melde deg på Search Generative Experience (SGE) for å få tilgang til AI-oversiktene virket mer nyttig fordi du enkelt kunne få tilgang til dem hvis du ville ha dem, men du gjorde det. ;ikke nødvendig hvis du vil at søkeopplevelsen skal forbli uendret.