0
Gør nisser har adresser, og hvis de gør, skal du matche dem?
Du tænker sikkert, det er et underligt spørgsmål at stille, og det er nok i endnu højere grad taget ud af kontekst. Det refererer til modsætningen mellem det op-in-the-sky forventninger og teorier, der er forbundet med kunstig intelligens (AI) og ofte verdslige arbejde, der kræves for at få det til at fungere i den virkelige verden.

Dybt Elon Musk, der findes, og det er ikke hvad du tror det er
Dybt Elon Musk
Enten måde, det lyder som den slags spørgsmål, som kunne få dig ned i et kaninhul. Så, når jeg tweeted, der for et stykke tid siden en henvisning til en historie offentliggøres derefter på AI i den virkelige verden, jeg var ikke så overrasket over at få et svar fra Dybt Elon Musk.
Dybt Elon Musk er en AI twitter-bot. I sin kerne, at det er en algoritme, der lærer at skrive. Det er blevet lavet ved hjælp af en LSTM Tilbagevendende Dybt Neurale Netværk, og det er uddannede ved at have det læst en masse af Tesla CEO Elon Musk ‘ s indlæg igen og igen. Man kan sige, det har taget sit eget liv.
Dybt Elon Musk genererer oprindelige tweets og interagerer med andre brugere på Twitter ved at lide deres tweets. Det behøver ikke gå så langt som at have fuldt interaktive samtaler, men da det blev kun udgivet i februar 2017, og det er oprettelsen af en enlig AI-entusiast, der allerede er noget af en præstation. Selv om det ikke forsøge at narre nogen, er det sandsynligvis kunne, som det helt sikkert er mere overbevisende end de fleste bots derude.
Dybt Elon Musk blev skabt af PJ Bergeron, en software-udvikler, der har bygget det for at se, om en AI kunne tale som et menneske. Han tog det ironiske i, Moskus egen frygt for AI, og som har en rig samling af Musk er tale offentligt tilgængelige gjort uddannelse bot nemmere.
Men hvis en person, du aldrig har hørt om, var i stand til at opbygge noget, som er det Googles verden ville være stolt af at arbejde solo i sin kælder uden omkostninger, så hvad er den egentlige Motorbriller i stand til at gøre, og hvad betyder dette?
Velkommen til ørkenen af de næsten fast
Google introducerede evne til at besvare dine e-mails til dig i 2015, og der er 10 procents chance for e-mails, du har modtaget fra dine kontakter automatisk blev genereret. Der er også gode chancer for, at nogle af dine online-interaktioner med anden måde professionel og/eller charmerende kolleger var ikke præcis, hvad du troede, de var.
Bergeron bygget Dybt Elon Musk, fordi han kunne, og fordi han mente, at det ville være sjovt. For den professionelle bot-producenter i verden, er den motivation, som er anderledes, og så er de potentielle konsekvenser.
Hvis du kan gøre det for Moskus, du kan gøre det for nogen, og her er mulighederne nærmest uendelige: Tror, personlige digitale assistenter, der kan blive din social media-kloner, for eksempel, tage væk byrde af online interaktion.
Du tror måske, at det er langt ude, og mange public relations fagfolk er enige med dig. Men det betyder ikke stoppe andre fra at de tager ud for at automatisere PR, eller fra at skabe virtuelle kloner. For Bergeron, den svære del er, at du er nødt til at få et stort datasæt til at træne dine AI:
For at skabe en “klon” af dig selv, du ville have til at skrive en masse. Løsningen kunne være at træne dine AI på en masse forskellige personer, så tog det en smule på dit eget indhold for at gøre det taler som dig. Så det første, lære at skrive på engelsk, så lær at skrive som DIG.
Og hvordan ville du føler om tanken om at have dine ord sat ind i en andens mund og have dem til at læse dem ud, som om de var deres egen? Godt, der er absolut muligt, igen ved hjælp af dybe læring (DL) ekspertise og public domain data.
Der Syntetiserer Obama
Et team på University of Washington (UW) lavet en splash for nylig, ved at offentliggøre en rapport om deres arbejde kaldes Syntese Obama. UW team, som Bergeron, anvendes en LSTM Tilbagevendende Dybt Neurale Netværk, der er uddannet på offentlige data.
Evnen til at syntetisere tale ved hjælp af enhver person fra offentligt tilgængelige optagelser er reel, her og nu. (Billede: University of Washington)
Supasorn Suwajanakorn, papir primære forfatter, påpeger, at dette har vist sig at fungere godt på mange audio signalbehandling opgaver såsom talegenkendelse. Han tilføjede, at deres fremgangsmåde var ikke baseret på det i sin helhed, som deres DL netværk er kun en del af hele rørledningen.
Som Suwajanakorn forklarede, det aspekt, der sætter dette arbejde fra hinanden, er, at det sænker markant bar for at opnå disse resultater, for en række årsager: “Den største forskel er, at vi kan producere overbevisende resultater ved at lære fra blot eksisterende optagelser af en enkelt person.
“Andet arbejde kræver, at den person, der skal scannes i et laboratorium, og har til omhyggeligt at konstruere en tale database, der består af mange mennesker siger, at pre-valgte sætninger. Dette er, hvad adskiller os og giver vores teknik til at blive skaleret til nogen med meget mindre indsats.”
Som for de ressourcer og knowhow, der er nødvendig for dette? Suwajanakorn sagde, at det tog dem cirka et år, og de havde brug for en klynge af computere til at hente data og en high-end maskine til forskning.
Holde i tankerne, men det var første gang, dette blev gjort, og UW havde holdet til at betale prisen for at bane vejen. Når du bliver spurgt, om nogen, der kender deres vej rundt i machine learning (ML), og som har adgang til moderat ressourcer kunne gøre noget som dette, Suwajanakorn var positiv.
Du, og hvad data videnskab hær?
Den afgørende forskel med Bergeron ‘s arbejde er, at i dette tilfælde de data, der var optagelser (Obama’ s ugentlige adresser til nationen), og det endelige mål var at få eksisterende tekst (Obama ‘ s egne indlæg) syntetiseret.
Men er der noget, der stopper dig fra at kombinere disse tilgange til at skabe, siger, falske nyheder, AI pop stjerner, og Max Headroom på steroider? Nej, egentlig ikke, siger Michal Kosinski.
Kosinski blev lidt af en husstand navn ved at blive krediteret med oprettelsen af de psykografiske model Cambridge Analytica angiveligt er anvendt til online politisk propaganda for den Brexit og Trump kampagner.
Kosinski har udviklet ML algoritmer, der kræver meget lidt i form af nødvendige data og regnekraft til at producere personlige profiler med usædvanlig nøjagtighed. Angiveligt disse profiler kan forudsige din adfærd mere præcist end selv dine nærmeste og kæreste mennesker.
Kosinski præsenteret nogle nye resultater fra sin forskning i hans CeBIT keynote et par måneder tilbage. Han viste, hvordan de ved hjælp af simple, let tilgængelige data punkter såsom likes, kommentarer, billeder, personlige egenskaber og karaktertræk, der kan udledes med en høj grad af nøjagtighed. Og han gjorde det ikke ved hjælp af supercomputere i skyen, men hans egen laptop.
Hans pointe? Selv hvis du med succes kan regulere GAFAs af verden, vil du aldrig kunne regulere enlige ulve, og der er så meget mere er muligt, end hvad du tror du ved. Slutningen af privatlivets fred er her; lad os bare beskæftige sig med det.
Ja, det tager ekspertise og tid til at gøre dette, men husk på udviklingen er i sig selv blive automatiseret, og kan forventes at være commoditized, ligesom så mange andre før det. Snart, det kan ikke tage den metaforiske data videnskab hær for at få resultater som dette.
Når vi diskuterer potentielle anvendelser af hans arbejde, Bergeron sagde, at han kunne forfølge nogle af dem. Ingen af de grimme dem, der er ydet. Men ville der ikke være meget at stoppe ham, hvis han havde valgt at gå efter dem.
“Udefra er det altid virker mere skræmmende”
Så ingen regulering, ingen kontrol, ingen klar retning. Skal vi være bekymrede over, hvad der er muligt med teknologi som denne, og skal vi bare stole på den Motorbriller af verden til ikke at være onde?
Suwajanakorn afhandling kredser omkring disse spørgsmål: Hvilke aspekter af en person, kan du udlede, ved bare at kigge på deres billeder og videoer? Kan du model en persons personlighed, og skabe et digitalt menneske, der ser ud, taler, og fungerer ligesom dem?
Suwajanakorn vil være sammen med Google og har planer om at fortsætte på denne linje af arbejde, som var en del af et bredere projekt, der involverer Samsung, Google og Intel, selv om han siger, at hans bevægelse er uafhængig af denne. Lyder det lige så fantastisk og bekymrende?
Kunne det være, at vores evne til teknologiske fremskridt, der er langt større end vores kapacitet til sociale og etiske udvikling, eller at vi skal blot stoppe op og tænke et stykke tid, før marcherer videre til nye tech højder?
Suwajanakorn sagde, at dette er et kompliceret spørgsmål, og normalt alt, er ikke klart: “jeg mener, at forskere skal tage etiske hensyn og i den offentlige debat og frygt bør være informeret af teknisk forskning.
“Jeg kan se, hvordan udefra altid det virker mere skræmmende. Der er et potentiale for misbrug, men jeg kan se mange måder at [denne] kan forebygges og mange flere udfordringer, før vi endda nå dette punkt.”
Hvem der egentlig ejer din Internet af Ting, data?
I en verden, hvor flere og flere objekter kommer online og leverandører er ved at blive involveret i forsyningskæden, hvordan kan du holde styr på, hvad der er dit og hvad er ikke?
0