Hva det er som å se en IBM-AI vellykket debatt mennesker

0
163

På en liten hendelse i San Francisco i går kveld, IBM arrangert to debatten club-stil diskusjoner mellom to mennesker og en AI kalt “Prosjekt Debattant.” Målet var for AI til å engasjere seg i en rekke begrunnet med argumenter i henhold til noen ganske vanlige regler for debatt: ingen bevissthet om den debatt tema i forkant av tid, ingen pre-hermetisert svar. Hver side ga en fire-minutters innledende tale, en fire-minutters innsigelsen til den andres argumenter, og en to-minutters avsluttende uttalelse.

Prosjektet Debattant holdt sin egen.

Det ser ut som et stort sprang utover det andre splashy demonstrasjon vi alle husker fra IBM, når Watson tørker gulvet med konkurrentene i Fare. IBM ‘ s AI demonstrasjon i dag ble bygget på det grunnlaget, det hadde mange ord av data det kan trekke fra, akkurat som Watson gjorde tilbake i dag. Og som Watson, det var i stand til å analysere innholdet av alle dataene for å komme opp med relevante svar — men denne gangen er det “svar” var overbevisende poeng i slekt å subsidiere plass og telemedisin lagt ut på en fire minutters tale å forsvare hver.

Prosjektet Debattant sitert kilder, pandered til publikums engasjement for barn og veteraner, og gjorde en brukbar jobb med å knekke en relevant spøk eller to i prosessen.

Det er ganske imponerende — det er egentlig laget en freshman-nivå semesteroppgave slags argument i bare et par minutter flat når presentert med en debattere emnet det hadde ingen spesiell forberedelse. Systemet har “flere hundre millioner artikler” som vi forutsetter er nøyaktige i sine data banker, rundt om 100 områder av kunnskap. Når det blir en debatt emnet, det tar et par minutter å huleutforsking gjennom dem, bestemmer seg for hva som ville gjøre det beste argumenter i favør av emnet, og oppretter deretter en liten tale som beskriver disse punktene.

Noen av punktene som det gjorde var ganske lettvint, litt siterte kilder, og noen var ganske tydelig cribbed fra artikler. Likevel, selv om det var i stand til å flytte fra “presentere informasjon” – modus, som vi vanligvis tenker på når vi hører AI til en “gjør et argument” – modus. Men det som imponerte meg var at den forsøkte å direkte argumentere med poeng som sine menneskelige motstandere laget, i nesten sanntid (systemet trengte et par minutter til å analysere menneskets 4-minutters tale før det kan svare).

Var AI krangler i god tro? Jeg var ikke helt sikker på

Det ærlig talt gjort meg litt urolig, men ikke på grunn av den vanlige bekymringer som “roboter kommer til å bli selvbevisst og ta over” eller “AI kommer for jobbene våre.” Det var noe mer subtil og vanskeligere å sette fingeren på. For kanskje første gang, følte jeg meg som en AI prøvde å dissemble. Jeg fikk ikke se det ligge, og heller tror jeg det prøvde å lure oss, men det gjorde engasjere seg i en diskutere taktikk som, hvis du så et menneske prøve det, ville gjøre du stole på at menneskelig litt mindre.

Her var scenen: et menneske debattant var argumenterer mot bevegelse som regjeringen bør subsidierte utforskning av verdensrommet. Hun satt opp et rammeverk for å forstå verden — en ganske vanlig diskutere taktikk. Subsidier, hun hevdet, passer som ett av to spesifikke kriterier: oppfylle grunnleggende menneskelige behov og skape ting som bare kunne gjøres av regjeringen. Utforskning av verdensrommet ikke passer regningen. Fair nok.

Prosjektet Debattant, hvis jobb var å svare direkte på disse punktene, ikke helt tilbakevise dem direkte. Det er sikkert snakket i samme sone: det hevdet at “subsidiere utforskning av verdensrommet vanligvis avkastning på investeringen” i form av økonomiske øker fra vitenskapelig oppdagelse, og det sies at for en nasjon som Usa, “å ha en utforskning av verdensrommet programmet er en kritisk del av å være en stor makt.”

Hva Prosjektet Debattanten ikke er direkte engasjere de kriterier som er fastsatt av sin menneskelige motstander. Og her er tingen: hvis jeg var i den debatten jeg ville ikke ha gjort det heller. Det er en sterk diskutere taktikk for å sette rammene for debatten, og aksepterer at rammene er ofte en oppskrift for å miste.

Spørsmålet er da: har Prosjektet Debattant rett og slett ikke forstå kriterier, eller gjorde det korrekt, og velger ikke å delta på de vilkår? Se på debatten, jeg skjønte det svar at det var ikke helt få det — men jeg var ikke positiv. Jeg kunne ikke fortelle forskjellen mellom en AI ikke blir så smart som den kan være, og en AI blir smartere måte enn jeg har sett en AI være før. Det var en ganske kognitivt disharmoni øyeblikk. Som jeg sa: foruroligende.

“Hvis det virkelig mener det forstår hva som motstander var å si, det kommer til å prøve å lage et veldig sterkt argument mot det punktet som er spesielt.”

Jeff Welser, VP og lab direktør for IBM forskning i Almaden, sette tankene mine på brukervennlighet. Prosjektet Debattanten ikke får det. Men det fikk den ikke i et veldig interessant og viktig måte. “Det har vært noen forsøk på å faktisk spille det vanskelig eller dissembling spill,” sier han til meg (puh). “Men det gjør faktisk gjør … nøyaktig hva et menneske gjør, men det gjør det innenfor sine begrensninger.”

I hovedsak, Prosjekt Debattant tildeler en tillit poengsum til hver bit av informasjon det forstår. Som i: hvor sikker er systemet at det faktisk forstår innholdet i det som blir diskutert? “Hvis det er sikre på at det kom som peker rett, hvis det virkelig mener det forstår hva som motstander var å si, det kommer til å prøve å lage et veldig sterkt argument mot det punktet som er spesielt,” Welser forklarer.

“Hvis det er mindre sikker på,” sier han, “det vil gjøre det best å foreta et argument som vil være overbevisende som argument, selv om det ikke akkurat svare på det tidspunktet. Som er nøyaktig hva et menneske gjør også, noen ganger.”

Så: den menneskelige sier at regjeringen skal ha bestemte kriterier rundt grunnleggende menneskelige behov for å rettferdiggjøre subsidization. Prosjektet Debattant svarer at plassen er fantastisk og bra for økonomien. Et menneske kan velge at taktikken som en slu måte å unngå å debattere på feil premisser. Prosjektet Debattant hadde ulike motiver i sine algoritmer, men ikke så forskjellige.

Poenget med dette eksperimentet var ikke til å gjøre meg til å tenke at jeg ikke kunne stole på at en datamaskin er hevdet i god tro — selv om det er veldig mye gjorde det. Nei, poenget er at IBM viser at det kan trene AI i nye områder av forskning som til slutt kan være nyttig i det virkelige, praktiske sammenhenger.

Den første er parsing mye av informasjonen i en beslutningsprosess sammenheng. Den samme teknologien som kan lese et korpus av data og komme opp med en haug av fordeler og ulemper for en debatt kan være (og har vært) brukes til å bestemme om eller ikke en aksje kan være verdt å investere i. IBMS system ikke gjør verdi dom, men det gjorde gi en haug av informasjon til banken som viser begge sider av en debatt om lager.

“Dette er fortsatt et forsknings-nivå-prosjektet.”

Som for å debattere del, Welser sier at det “hjelper oss til å forstå hvordan språket brukes, ved å lære et system til å fungere i et retorisk kontekst som er mer nyansert enn det som er vanlig Hei Google gi meg dette stykket av informasjon og slå av mine lys. Kanskje det er kanskje en dag vil hjelpe en advokat struktur sine argumenter, “ikke at Prosjektet Debattant ville gjøre en veldig god advokat,” han spøkte. En annen IBM forsker foreslått at denne teknologien kan hjelpe dommer falske nyheter.

Hvor nært er dette å være noe IBM blir til et produkt? “Dette er fortsatt et forsknings-nivå prosjekt,” Welser sier, selv om “teknologi under det akkurat nå” er allerede begynt å bli brukt i IBM prosjekter.

I den andre debatten, om telemedisin, Prosjekt Debattant igjen hadde en vanskelig tid å analysere nøyaktig nuance sin menneskelige motstander var å gjøre om hvor viktig den menneskelige kontakten er i diagnosen. Heller enn å diskutere det, og det falt tilbake til en bredere diskusjon, noe som tyder på at kanskje det menneskelige var bare redd for nye innovasjoner.

“Jeg er en sann troende i kraft av teknologi,” quipped AI, “som jeg burde være.”