Stell dir vor, du lebst in einigen dystopischen Zukunft, und Sie wurden beschuldigt wird, eine hochentwickelte KI, die ist verboten in dieser Gesellschaft. Die Strafe ist der Tod, und um Sie davon zu überzeugen, den Richter, die entscheiden, Ihr Schicksal, Sie kann nur völlige ein Wort, jedes Wort aus dem Wörterbuch, zu beweisen, dass Sie Fleisch und Blut. Welches Wort wählst du?
Es klingt wie das setup für ein käsiger sci-fi, kurze, aber dies ist tatsächlich Teil einer neugierig das Papier aus einem paar von Forschern am MIT auf etwas, was Sie rufen Sie die “Minimale Turing-Test.”
Statt einer Maschine versuchen, jemanden davon zu überzeugen, dass Sie ein Mensch sind durch das Gespräch — das war die Prämisse des ursprünglichen Turing-Test, beschrieben von britischen Wissenschaftler Alan Turing in seiner wegweisenden 1950 paper “Computing Machinery and Intelligence” — der Minimale Turing-Test fragt nach einem Wort, entweder völlig frei gewählt oder ausgewählt aus ein paar Worten.
Die Forscher verantwortlich, John McCoy und Tomer Ullman, klarzustellen, dass der Minimale Turing-Test nicht einen benchmark für KI-Fortschritt, sondern ein Weg des Ausprobierens, wie Menschen sich selbst sehen in Bezug auf Maschinen. Diese Frage wird zunehmend relevant in einer Welt, die gefüllt ist mit KI-Assistenten, deepfaked Menschen, und Google automatische Antworten der Umgang mit Ihren E-Mail. In einer Welt, die der Mensch-wie AI, was wir denken, macht uns einzigartig? Was macht uns anders?
In der ersten von McCoy und Ullman ‘ s zwei tests, 936 Teilnehmer wurden aufgefordert, wählen Sie jedes Wort, das Sie mochte, dass Sie dachten, er könnte einen Beweis für Ihre Menschlichkeit. Trotz der freien Auswahl, Ergebnisse rund um eine kleine Anzahl von Themen. Die vier am häufigsten abgeholt Wörter waren “Liebe” (134 Antworten), “Mitgefühl” (33 Antworten), “human” (30 Antworten) und “bitte” (25 Antworten), die aus einem Viertel aller Antworten. Andere Gruppen waren Empathie (Wörter wie “emotion”, “Gefühl” und “Sympathie”), und den glauben und die Vergebung (Worte wie “Barmherzigkeit”, “Hoffnung” und “Gott”).
Alles in allem, der 936 Antworten abgedeckt 428 einzelne Wörter, die eine auffallende Menge von zusammenhalt.
Antworten aus ein-Wort-test zeigen die beliebtesten einzige Antwort war “Liebe”.
Bild von McCoy und Ullman / MIT
In der zweiten Prüfung, 2,405 Teilnehmer hatten die Wahl zwischen Paaren von Worten, die Entscheidung, welche der beiden Sie dachte, war ein Mensch und eine Maschine. Nochmals, Worte wie “Liebe”, “Mensch” und “bitte” scored stark, aber der Gewinn word war das einfacher und deutlich biologisch: “kacke.” Ja, aus all den Wort-Paarungen, “poop” wurde gewählt, am häufigsten, um zu bezeichnen, dass die Essenz und Seele der Menschheit. Poop.
Sprechen, um Die Schwelle zu McCoy der MIT Sloan Neuroökonomie Labor, betonte, dass der test ging es mehr um soziale Psychologie als in der informatik.
“Wir sehen es nicht als die nächste CAPTCHA,” McCoy sagt. “Die praktischen Anwendungen, es hat in der KI-computer-Raum ist mehr, wenn Sie daran denken, user interface design und Dinge wie, dass. In diesen Kontexten ist es vielleicht nützlich zu wissen, wie Menschen denken über Computer und was Sie denken, Sie abgesehen.”
Der Turing-Test ist kein guter benchmark für KI-Intelligenz von selbst
Dies macht Sinn, da auch die ursprünglichen Turing-Test lange hat gefallenen aus der Gunst der Informatiker als test für die Intelligenz an der Maschine. Kritiker sagen, dass es testet die Fähigkeit der Programmierer zu finden, Konversation hacks, trick Menschen mehr als Intelligenz.
Zum Beispiel, im Jahr 2014, die Berichterstattung ausgeprägt, dass der Turing-Test übergeben worden, die von einem chatbot. Die Programmierer überlistet Richter, indem er Ihr bot identifizieren, die sich als 13-jähriger Ukrainischer junge namens Eugene Goostman. Dies bot die perfekte Deckung für die bot ‘ s viele Fehler, und seine Unfähigkeit, gewisse Fragen zu beantworten. Als Kritiker wie Informatiker Gary Marcus bemerkte: “Was Goostman ist der Sieg wirklich zeigt … ist nicht das Aufkommen von SkyNet oder cyborg-Kultur, sondern vielmehr die Leichtigkeit, mit denen können wir täuschen andere.”
Aber dies ist nicht zu sagen, dass der Turing-Test ist nutzlos. Erstellen von computer-Programmen, chat überzeugend ist eine fruchtbare Herausforderung für die KI-Forscher, die möglicherweise zum Wohle der Menschen. Der test wird auch noch eine fantastische Gedanken-experiment, das uns helfen kann, zu erforschen, die komplexe Fragen rund um unser Verständnis von Intelligenz. Wir können auch ändern, es schärft seinen Fokus durch Fragen Computern nicht nur chatten, sondern um Anfragen zu beantworten, erfordert ein differenziertes und reichhaltiges Verständnis der Welt. (Ein Beispiel ist zu Fragen, einen computer, “Was sind die Pluralformen von ‘platch” und “snorp’?” Ein Mensch würde wohl Antworten “platches” und “snorps,” trotz der Tatsache, dass diese Wörter sind Unsinn und kann nicht in einem Wörterbuch gefunden werden.)
Es ist in diesem Rahmen, dass die Minimale Turing-Test ist am besten geschätzt, wie ein Gedankenexperiment, nicht um eine benchmark für KI-Fortschritt. McCoy sagt, was ihn überrascht die meisten über die Forschung war nur, wie viel Kreativität es in den Antworten. “Die Menschen kamen mit allen möglichen interessanten shibboleths und Wortwitz”, sagt er, mit Worten wie “bootylicious” “supercalifragilisticexpialidocious.” (Versuchen Schreibweise, die ohne Google).
“Es sagt etwas über die Kluft zwischen den Menschen und intelligente Roboter”, sagt McCoy, “dass Menschen, die nie gehabt haben, denken Sie über diese situation vor und kam mit vielen interessanten und lustigen Ergebnissen.” Es ist etwas, in anderen Worten, dass ein computer zu kämpfen hätten.