Tänk dig att du lever i någon dystopisk framtid, och du har blivit anklagad för att vara en avancerad AI, som är förbjudet i det här samhället. Straffet är döden, och för att övertyga domstolen som kommer att avgöra ditt öde, du kan uttala bara ett ord, ett ord som du gillar från ordlistan, för att bevisa att du är kött och blod. Vilka ord väljer du?
Det låter som inställningar för en cheesy sci-fi-kort, men detta är faktiskt en del av en nyfiken papper från ett par av forskare vid MIT på något som de kallar den “Minimala Turing Test.”
Istället för en maskin att försöka övertyga någon att de är mänskliga genom samtalet — som var förutsättningen för den ursprungliga Turing-Testet, som beskrivs av den Brittiska forskaren Alan Turing i hans nyskapande 1950 artikeln “Computing Machinery and Intelligence” — den Minimala Turing Test ber för bara ett ord, antingen valt helt fritt eller hämtas från ett par ord.
De forskare som är ansvariga, John McCoy och Tomer Ullman, klargöra att den Minimala Turing Test är inte ett riktmärke för AI framsteg, men det är ett sätt att sondera hur människor ser på sig själva i förhållande till maskiner. Denna fråga kommer att bli allt viktigare i en värld fylld med AI assistenter, deepfaked människor, och Google auto svar som hanterar din e-post. I en värld av mänskliga-som AI, vad tror vi att vi skiljer oss? Vad gör oss annorlunda?
I den första av McCoy och Ullman två tester, 936 deltagarna ombads att välja ett ord de tyckte att de trodde skulle kunna vara bevis för deras mänsklighet. Trots den fria val, resultat som ligger samlade kring ett litet antal teman. De fyra mest plockat ord var “kärlek” (134 svar), “medkänsla” (33 svar), “mänskliga” (30 svar), och “snälla” (25 svar), som utgör en fjärdedel av alla svar. Andra kluster var empati (ord som “känslor” och “känslor” och “sympati”), och tro och förlåtelse (ord som “nåd”, “hoppas” och “gud”).
I samtliga 936 svar som omfattas 428 enskilda ord, vilket är en imponerande mängd av sammanhållning.
Svar från ett ord-test visar de mest populära enda svar var “kärlek”.
Bilden av McCoy och Ullman / MIT
I det andra testet, 2,405 deltagarna hade att välja mellan par av ord, att avgöra vilken av de två trodde de var som ges av en människa och en maskin. Igen, ord som “kärlek”, “mänsklig” och “snälla” fått starkt, men det vinnande ordet var enklare och tydligt biologiska: “bajs.” Ja, av alla ord lottning, “bajsa” ut oftast för att beteckna själva kärnan och själen i mänskligheten. Bajs.
Sett till Gränsen, McCoy av MIT: s Sloan Neuroekonomi Laboratorium, betonade att testet var mer om social psykologi än datavetenskap.
“Vi vill inte se att det används som nästa CAPTCHA,” McCoy säger. “Den praktiska tillämpningen har det i AI dator utrymmet är mer när du funderar på user interface design och sånt. I de sammanhangen, det är kanske bra att känna till hur människor tänker om datorer och vad de anser skiljer dem.”
Turingtestet är inte ett bra riktmärke för AI intelligens av sig själv
Detta är logiskt, eftersom även den ursprungliga Turing Test har länge fallit i onåd med datavetare som ett test av maskinens intelligens. Kritikerna säger att det testar förmågan av programmerare för att hitta konversera hack som kan lura människor mer än intelligens.
Till exempel, i och med 2014, nyheter täckning uttalas att Turing Testet hade genomförts av en chatbot. Programmerare luras domare genom att ha sin bot identifiera sig som en 13-åriga ukrainska pojke som heter Eugene Goostman. Detta gav en perfekt täckmantel för bot många misstag och dess oförmåga att svara på vissa frågor. Som kritiker gillar datavetare Gary Marcus noterade, “Vad Goostman seger verkligen avslöjar … är inte tillkomsten av SkyNet eller cyborg kultur utan snarare den lätthet med vilken vi kan lura andra.”
Men detta är inte att säga att turingtestet är värdelös. Att skapa datorprogram som kan chatta på ett övertygande sätt är en givande utmaning för AI-forskare som kan gynna mänskligheten. Testet är också fortfarande ett fantastiskt tankeexperiment som kan hjälpa oss att utforska komplexa frågor kring vår förståelse av intelligens. Vi kan också ändra det till att skärpa sitt fokus genom att ställa datorer inte för att chatta helt enkelt, men för att svara på frågor som kräver en nyanserad och rik förståelse av världen. (Ett exempel är att ställa en dator, “Vad är plural av “platch” och “snorp’?” En människa skulle förmodligen svara “platches” och “snorps,” trots det faktum att dessa ord är nonsens och kan inte hittas i ordlistan.)
Det är i detta sammanhang som den Minimala Turing Test är bäst uppskattas som ett tankeexperiment, inte en referens för AI framsteg. McCoy säger vad som förvånade honom mest om forskning var bara hur mycket kreativitet det var i svaren. “Folk kom upp med alla typer av intressanta shibboleths och ordlekar,” säger han, med ord som “bootylicious” “supercalifragilisticexpialidocious.” (Prova stavning utan Google.)
“Det säger något om skillnaden mellan människor och smarta robotar, säger McCoy, “att människor som aldrig behövt tänka på den här situationen innan de kom upp med en massa smarta och roliga resultat.” Det är något, med andra ord, att en dator skulle kämpa med.