Er denne mystiske chatboten virkelig GPT-4.5 i forkledning? Slik ser du selv

0
13
bot Francesco Carta fotografo/Getty Images

Siden lanseringen av ChatGPT har OpenAI fortsatt å jobbe med nye AI-prosjekter som bygger på suksessen og populariteten til AI-chatboten. Nå gir utseendet til en ny mystisk chatbot publikum en sniktitt på det siste prosjektet – og det er imponerende. 

Siste uke kom en ny chatbot kalt “gpt2-chatbot” ; dukket opp på Chatbot Arena, en åpen kildekodeplattform som brukes til å sammenligne ytelsen til de siste store språkmodellene (LLM). 

Også: Google var rett i å være bekymret: OpenAI ønsker angivelig å gå inn på søkemarkedet

Utseendet til denne chatboten skapte stor oppsikt på grunn av dens imponerende evner, som har overgått mange av de mest populære LLM-er på markedet, som Gemini, Claude og til og med GPT-4. Til manges skuffelse ble imidlertid gpt2-chatbot fjernet fra Chatbot Arena kort tid etter at den dukket opp på plattformen. 

Fra og med i går kveld, hvis du besøker Chatbot Arena, vil du møte det som ser ut til å være to varianter av den originale chatboten, kalt henholdsvis 'im-a-good-gpt2-chatbot' og 'im-also-a-good-gpt2-chatbot'. 

Til tross for at de to modellene har "GPT" tittel eksklusiv for OpenAIs familie av Generative Pre-trained Transformer (GPT) LLMs, har selskapet ikke offisielt erkjent at det jobber med modellen. Imidlertid skrev OpenAI-sjef Sam Altman et kryptisk innlegg på X som nettopp oppga navnet på LLM, “im-a-good-gpt2-chatbot”," som ser ut til å bekrefte forbindelsen mellom OpenAI og modellen, som vist nedenfor. 

Selv om modellene er tilgjengelige i Chatbot Arena, er det vanskelig å få tilgang til dem. Hvis du ser på listen over LLM-er som støttes av Chatbot Arena, vil du ikke se modellene oppført der. Som et resultat vil du ikke kunne teste dem i Chatbot Arena (side-ved-side) sammenligning siden de ikke er inkludert i rullegardinmenyen. 

I stedet, hvis du vil for å få tilgang til dem, må du fortsette å starte en Arena (kamp)-sammenligning — som tilfeldig velger ut to LLM-er for å konkurrere mot hverandre — til en av de to nye modellene kommer opp. Det tok meg fem runder å endelig få det til å vises, som vist nedenfor. Men hvis du er fast bestemt på å teste det selv, kan ventetiden være verdt det. 

Chatbot Arena Chatbot Arena

Når modellen er avslørt og du ser at den enten er “im-a-good-gpt2-chatbot” eller “jeg-også-en-god-gpt2-chatbot”," du kan fortsette å chatte med den ved å legge til nye spørsmål for å teste funksjonene selv. Du kan fortsette å chatte til du bestemmer deg for å starte en ny runde eller oppdatere. 

Også: Disse fire nye Copilot for Microsoft 365-funksjonene gjør rask skriving som en proff enda enklere

Folk tar til X for å dele den nye anonyme modellens imponerende evner, som inkluderer å lage en Flappy Bird-klone med én ledetekst, lage en kodetolk som bruker Claude Opus, og til og med resonnere gjennom grunnleggende fysikkspørsmål.  

Disse forbedringene har fått folk til å spekulere i at modellen er OpenAIs GPT-5 eller GPT-4.5, utgitt under et pennenavn slik at OpenAI kan måle ytelsen nøyaktig. Når en bruker spurte "im-a-good-gpt2-chatbot" hvilken LLM-modell den brukte, sa chatboten: “Jeg er basert på GPT-4-arkitekturen, spesielt GPT-4.5-varianten.” 

Det er imidlertid ingen sikkerhet at dette ikke er et resultat av en hallusinasjon; inntil OpenAI bekrefter noe, er det best å være forsiktig når du bruker chatboten. Men hvis du er selv det minste nysgjerrig, oppfordrer jeg deg til å prøve det siden det er gratis.