Jeg testet Operas nye Gemini-drevne AI-funksjoner og ble imponert

0
17
Oppprioritet.

Arias oppfatning av en katt og mus som spiller sjakk.

Jack Wallen/ZDNET

Min favoritt nettleser, Opera, har en AI-funksjon kalt Aria en stund nå. I de sjeldne tilfellene jeg trenger AI-hjelp (for forsknings-/søkeformål), henvender jeg meg alltid til Aria. Til det formål har Operas AI vært ganske fantastisk.

Nylig kunngjorde Opera imidlertid at de vil begynne å legge til Googles Gemini AI-modeller for å hjelpe til med å drive Aria. Det betyr ikke at Opera har til hensikt å erstatte LLM (Large Language Model) som Aria bruker for øyeblikket. Faktisk bruker Aria flere AI-modeller for å svare på forespørsler (ved å velge modellen den føler vil fungere best for søket). Aria vil nå også få tilgang til Google Gemini, som består av flere modeller (fra Gemini Nano til Gemini Ultra).

Også: 5 grunner til at Opera er favorittnettleseren min

Denne nye integrasjonen handler ikke bare om å kunne svare raskere og mer nøyaktig på forespørsler. Brukere vil også finne at Operas Aria AI nå inneholder nye funksjoner, for eksempel muligheten til å lese svar høyt. Den er også i stand til å gjengi bilder basert på spørringer, takket være Imagen 2-modellen på Vertex AI. 

Opera har også introdusert et AI Feature Drops-program. I følge Krystian Kolondra, EVP ved Opera, beveger AI seg raskt, og det gjør vi også. Vi har startet AI Feature Drops-programmet for å la folk teste våre nyeste AI-utforskninger som enten vil eller ikke kommer til den offisielle versjonen av Opera One. Vi er glade for å la våre mest engasjerte brukere teste og dele sine tilbakemeldinger og forslag med oss."

Også: Jeg er en hardfør Pixel-bruker, men jeg vurderer en endres av to grunner

Jeg lastet ned Opera Developer-utgaven for en tid siden, og like etter kunngjøringen ble oppdateringen gjort tilgjengelig. Jeg brukte oppdateringen og sparket dekkene til den nye Aria AI og ble imponert.

En ting å huske på er at både tale- og bildefunksjonene har vært tilgjengelige på Operas skrivebordsversjon for utviklere siden slutten av april. Forskjellen er at begge funksjonene er mer pålitelige og betydelig raskere, takket være tillegget av Googles LLM-er. På toppen av det, før du tok i bruk Googles AI-modeller, var ikke tekst-til-tale i Aria akkurat konverteringslignende. 

La oss grave inn.

< h2>Tekst til tale

Den første funksjonen jeg testet var tekst-til-tale. For å bruke den, kjører du en spørring i Aria. Når spørringen er fullført, hold markøren nær øverste høyre hjørne av svaret for å vise en meny som inneholder et lite høyttalerikon. Klikk på det ikonet og AI-stemmen vil begynne å lese svaret. Til min overraskelse hørtes stemmen ganske realistisk ut. Ja, jeg kunne fortelle at det var AI til tider (spesielt når det kom til mindre vanlige navn), men totalt sett hadde lyden en naturlig tonehøyde, tømmer og kadens (langt bedre enn Googles assistentstemme).

Operas Aria som definerer Linux.

Jeg ba Aria forklare Linux.

Jack Wallen/ZDNET

Du kan ikke endre stemmen eller hastigheten den snakker med, men du kan sette den på pause (ved å trykke på pauseknappen). Denne funksjonen er tilgjengelig på både desktop- og mobilversjonen av Opera (utvikler på skrivebordet og beta på Android).

Bildegenerering

De eneste endringene i Arias bildegenerering ( siden Gemini-adopsjonen) er i sin hastighet og pålitelighet. Før Gemini testet jeg bildefunksjonen og fant ut at den noen ganger ikke kunne håndtere spørringen og ville svare med en feil. Prøv igjen, og det kan lykkes. Ved hjelp av Imagen 2 på Vertex AI, svikter aldri bildegenerering. 

Har jeg unnlatt å nevne at bildegenerering også er gratis med Aria?

For øyeblikket , er bildegenereringsfunksjonen bare tilgjengelig for skrivebordsversjonen (utvikler) og ikke mobilversjonen. 

Hvis du er interessert i AI, vil jeg sterkt anbefale deg å gi Opera Developer og Aria et forsøk. Fra min erfaring er Operas oppfatning av AI den beste av alle nettlesere (og den er ikke i nærheten engang).