Hva er Gemini Live? En første titt på Googles nye sanntids stemme-AI-bot

0
42
Google

Etter  OpenAIs banebrytende kunngjøringer denne uken, demonstrerte Google nettopp sin egen superkraftige stemmeassistent for kunstig intelligens til rival GPT-4o. Gemini Live er en mobil samtaleopplevelse som utnytter en forbedret multimodal AI-modell for å tilby brukere en mer naturlig samtaleopplevelse i sanntid. 

Også: Alt annonsert på Google I/O 2024 : Gemini, Search, Android 15 og mer

Med Gemini Live kan brukere ha talesamtaler med Gemini som føles naturlige og intuitive. For eksempel kan de stille Gemini Live-spørsmål i sitt eget tempo og avbryte AI-roboten midt i setningen for å få den til å avklare eller justere hvordan den svarer, på samme måte som OpenAI viste frem med GPT-4o under demoen i går. Google vil tilby en rekke stemmer for brukere å velge mellom for Gemini Live-opplevelsen, slik OpenAI har gjort med ChatGPT siden den la til Whisper-integrasjonen i september i fjor.

Google sier at den vil legge til den fulle multimodale opplevelsen til Gemini Live senere i år, slik at den kan se verden rundt brukeren når de åpner kameraet under en samtale. Dette er enda en ting som brukere vil kunne gjøre med ChatGPT i løpet av de kommende ukene gjennom en oppdatering som først vil bli rullet ut til ChatGPT Plus-brukere. 

Også: ChatGPT vs. ChatGPT Plus: Er et betalt abonnement fortsatt verdt det?

Blant denne og andre oppdateringer har Google oppgradert Gemini Nano til å behandle tekst, bilder og lyder, ikke lenger begrenset til tekstinndata. Gemini Nano med multimodalitet vil være tilgjengelig fra og med Pixel-smarttelefoner.