AI skriver fortsatt elendig poesi

0
111

 Tiernan Ray

Av Tiernan Ray | 3. juni 2021 – 14:13 GMT (15:13 BST) | Tema: Kunstig intelligens

Hennes øyne, tvillingbassenger av mystisk lys,
For alltid i hennes utstråling hvite—,
Hun søkte nattens favn.
Bort kom det, det mystiske synet!

– Anonym menneskelig forfatter i samarbeid med poesi-algoritme

En undersøkelse av nyere litteratur i maskinlæringskategorien kunstig intelligens viser jevn fremgang i utviklingen av teknikker for automatisk generering av poesi.

Produksjonen forblir ganske middelmådig, men den blir god nok til at noen menneskelige lesere vil gi diktene respektable karakterer i kontrollerte evalueringer. Og noen mennesker vil til og med bli lurt til å tilskrive menneskelig forfatterskap til maskinpoesi.

Mens det essensielle i den mest sublime formen for menneskelig skriving slipper unna AI, er programvaren dyktig nok til å generere faksimiler som kan bestå en test.

Diktet oppført øverst i denne artikkelen ble delvis laget av en maskin. Et Google-program, kalt Verse by Verse, introdusert i mars, tar et stykke innspill fra et menneske, den første linjen med tekst, Hennes øyne, to bassenger av mystisk lys. Deretter fortsetter strofe og produserer automatisk de påfølgende tre linjene.

Dette kvatrainet, som det heter, ble positivt betraktet av folkearbeidere som Google vervet for å sammenligne menneskets kreasjoner pluss maskin med dikt skrevet helt av et menneske. Programmet og evalueringene er beskrevet i introduksjonen av Google-forskere David Uthus, Maria Voitovich og R.J. Mical.

Verse by Verses evne til å produsere tekst er et resultat av at programmet har fått i seg et korpus med tjueto forskjellige dikteres arbeid. På programmets nettsted blir en bruker invitert til å velge opptil tre av de berømte dikterne som “muses” for å fullføre et dikt som brukeren leverer første linje for.

Resultatene er et morsomt salongspill og et elendig dikt. Dette er hva som skjer når vers for vers blir matet den første linjen i Rainer Maria Rilkes Duino Elegies:

 von-rilng-my-dikt.

Firelinjens utgang krever at brukeren velger blant flere foreslåtte linjer generert av algoritmen, hver linje er betinget av å være i venen til en av de tre valgte dikterne. Mens noen andre kombinasjoner kan være mer ønskelige – valg og mulighet er signaturelementer i automatisk tekst – er det usannsynlig at noen banebrytende vers vil dukke opp selv med mange forsøk.

 vers av vers -vers-poesi-arkitektur-juni-2021.jpg

Poesiemaskinen: Googles vers for vers tar inn en kropp av jobbe som input for å trene et transformator nevralt nettverk for å generere tekst generelt, og deretter kan den endelige utgangen fra en hvilken som helst brukersesjon være betinget av inngangsprøver av bestemte poeter.

Uthus et al.

Vers for Verse er et eksempel på en trend det siste tiåret blant AI-forskere i den akademiske verden, og forskere fra Google og andre store selskaper, for å foredle maskinlæringsprogrammer som enten genererer et helt nytt arbeid eller utvider et uttrykk fra en person.

Arbeidene bruker alle det som kalles språkmodeller, programmer som bruker maskinlæring for å bygge en statistisk fremstilling av hvordan ord vanligvis faller sammen i en setning. Den paradigmatiske språkmodellen er GPT-3, et program som ble utgitt i fjor av San Francisco-oppstart OpenAI som har tatt verden med storm.

Mange kommentatorer har blitt helt slått av den tilsynelatende menneskelige teksten til GPT-3. New Yorker's Stephan Marche har skrevet at GPT-3 kan skrive som Franz Kafka, og siterer et utdrag av Metamorphosis omskrevet av GPT-3.

Også: Hva er GPT-3? Alt virksomheten din trenger å vite om OpenAIs banebrytende AI-språkprogram

Faktisk høres ikke redux ut som originalen. Men Marche og andre har tatt tak i hovedprestasjonen til GPT-3 og andre språkmodeller, som er å replikere overflatekvaliteten til ordkombinasjoner, som kan inkludere stilistisk emulering.

Poesi har vært et populært valg for å presse grensene for hva slike språkmodeller kan fange fordi mest poesi er preget av formelle kvaliteter som kan måles statistisk inkludert meter, rimoppsett og assonans.

Nyere arbeid med AI-poesi søker å etterligne disse formelle elementene med økende strenghet.

Kevin Yang og Dan Klein fra U.C. Berkeley publiserte i april et papir om deres oppfinnelse, kalt FUDGE, som automatisk kan generere den andre linjen i Shakespeares koblinger, spontant replikere iambisk pentameter, stressmønsteret som Shakespeare brukte så effektivt.

Det som dukker opp er klumpete par, men anstendig formalisme. Her er Shakespeares originale sonett nummer 48:

Hvor forsiktig var jeg da jeg tok min vei,
Hver bagatell under de sanneste stolpene å skyve,
Det til mitt bruk kan være ubrukt opphold
Fra løgnens hender, i sikkerhet avdelinger av tillit!
Men du, som mine juveler er små ting til,
Mest verdig trøst, nå min største sorg,
Du best av kjæreste, og min eneste bryr meg,
Art forlot byttet til enhver vulgær tyv.
Du har jeg ikke låst inne i noen brystkasse,
Lagre der du ikke er, selv om jeg føler at du er,
Innenfor den milde lukkingen av brystet mitt,
Hvorfra du kan komme og komme del;
Og til og med derfra vil du være stol'n, frykter jeg,
For sannheten viser seg tyverisk for en pris så kjær.

I FUDGE tar Yang og Klein første linje i sluttkuppelen, og til og med derfra vil du være stol'n, frykter jeg, og få programmet til å skrive en ny andre linje. Det som kommer ut er ikke like poetisk og bærer ikke spor av sonettens utvidede metaforer:

Og selv derfra vil du bli stol'n, frykter jeg,
for dette skal være slutten. Det er ganske klart.

Teknologisk sett er FUDGE en tour de force. Yang og Klein har tatt GPT-3s forgjenger fra 2019, GPT-2, og justert den. (GPT-2 er tilgjengelig for nedlasting, noe som gjør det til et populært valg for språkmodellutvikling, i motsetning til GPT-3, hvis bruk er begrenset av OpenAI.)

GPT-2 og GPT-3 gjør ikke vet noe om iambisk pentameter, de bare aper uansett hvilken stil de får. Ved å legge til noen kodelinjer klarte Yang og Klein å tvinge FUDGE til å holde seg iambisk pålitelig. Derfor oppfyller FUDGE-couplets en stilistisk forpliktelse på en konsekvent måte.

Yang og Klein, til deres ære, er under ingen illusjoner om kvaliteten på den genererte kuppelen. “Shakespeare er bare inkludert som et lunefullt referansepunkt,” skriver de, “våre generasjoner holder tydeligvis ikke et lys til Shakespeares originaler.”

Når maskindikt faller flatt, er det desto mer åpenbart innenfor en helt spesiell formell tradisjon. Ta limericks, de elskede femlinjediktene som har en jevn ordning av stavelser og en konsekvent rimordning.

Michael Palin, fra Monty Python-berømmelse, har tilbudt limericks av sin egen skapelse:

De sa om en jordmor som heter Paula,
Hvis det var noen problemer, bare ring henne.
Hennes ferdigheter i vannet
Hun lærte av en bærer
Som leverte fisk fersk av en tråler.

Uansett om slike dikt er morsomme eller ikke, og de er ment å være det, har de vanligvis en komplett ide som spilles ut i de fem linjene, med en slags vri eller overraskende sving som er designet for å gi glede.

For å prøve å generere limericks automatisk, debuterte Jianyou Wang og kollegaer ved Duke University i mars LimGen. LimGen bruker det som kalles en mal, et sett med regler for hvordan limerick-linjer dannes, for eksempel et emne pluss et verb pluss et objekt. Det er basert på 300 limericks som eksempler, et relativt lite utvalg.

Wang og team legger til malen en annen algoritme, populær i språkmodeller, kalt strålesøk. Den scorer automatisk teksten som genereres av malprogrammet for å velge den beste utgangen, som en slags stemmeautoritet.

Resultatene i et fornuftig arbeid, ved å føle at de minner om limericks, men det er noe flatt med dem:

Det var en ærlig mann ved navn Dwight
Som mistet alt pengene hans i en kamp.
Hans venner var så opprørte,
De var villige til å satse,
Og de likte ikke følelsen av til tross.

Det var en høy servitør ved navn Jacque,
som helte all kaffen i en riste.
Men i det øyeblikket hun rørte seg,
Hun ble truffet av en fugl,
Så så hun den fly mot sjøen.

Selv om det omtrent er kontinuitet i disse limerikene, er det en merkelig oppløsning mot slutten av hver strofe, som om ideens utvikling har blitt overgitt til de formelle begrensningene.

 wang-et-al -limgen-architecture-2021.jpg

Limerick-maskinen: En mal samler setninger som automatisk samsvarer med kjente begrensninger for hva hver linje med en limerick skal være, og deretter velger en automatisk søkefunksjon, kalt beam search, de beste kandidatlinjene.

Wang et al.

Gitt de utilfredsstillende resultatene av rå produksjon, vil flere programmer trolig etterligne Googles menneskelige samarbeid i vers for vers.

Den vanlige betegnelsen i AI for den kombinerte innsatsen er menneske-i-løkken. En slående inversjon som har dukket opp er “computer-in-the-loop.”

Imke van Heerden og Anil Bas, lærde fra Koç ̧University og Marmara University i Istanbul, debuterte i mars en datamaskin-i-løkken-tilnærming for å verve mennesker til effektivt å redigere en maskingenerert tekst til et dikt. De fokuserer på Afrikaans, et av de offisielle språkene i Sør-Afrika og andre land i regionen, et språk som tradisjonelt ikke har fått mye oppmerksomhet i AI-språkmodeller.

Van Heerden og Bas sitt språkmodellprogram, kalt AfriKI, for “Afrikaanse Kunsmatige Intelligensie”, kunstig afrikansk intelligens i Afrika, prøver eksplisitt å forbedre, i stedet for å fortrenge, menneskelig arbeid.

“Mens [generasjon av naturlig språk] i sin søken etter full automatisering kan rynke pannen etter menneskelig involvering, gjør vårt menneskesentrerte rammeverk det motsatte,” skriver de.

“Denne studien viser at samarbeid mellom maskin og maskin kan styrke menneskelig kreativitet.”

AfriKI inntar alle 208,616 ordene i en enkelt afrikanskspråklig roman, Die Biblioteek aan die Einde van die Wêreld (Et bibliotek ved verdens ende) av Etienne van Heerden.

I en prosess som virker lik Googles vers for vers, genererer AfriKI hundrevis av prosasetninger, og mennesket velger hvilke setninger de skal bruke, og i hvilken rekkefølge de skal samles til en strofe.

Resultatet er korte brikker som har noen levende bilder og noen interessante bruksområder for metafor:

Die konstabel se skiereiland

Afrika drikker
onheil i dø vann.
Die landskap kantel sy rug
in sigbewaking en vlam.
Ons oopgesnyde sake
brandtrappe for die ander state.
Dette grunnordet intimidasie.

Konstabelens halvøy

Afrika drikker en katastrofe i vannet.
Landskapet vipper ryggen til i overvåking og flamme.
Våre avskårne saker
brann unnslipper for andre stater.
Denne jorda blir skremmende.

Som forfatterne bemerker, er det nok figurativt språk og metafor her til å minne om noen lyrikeskoler. “Språket kan beskrives som minimalistisk, stemningsfull og abstrakt, og derfor åpent for tolkning, som ligner på imagistisk og surrealistisk poesi.”

Opp til et punkt. Diktene ser fremdeles ut til å være mest farget med farger, penselstrøk, uten å ha en idé.

Det er lett å se den vanlige fallgruven som alle språkmodellene bøyer seg for. Maskinlæringsprogrammer er transformasjonsmaskiner: deres nytte er å transformere noen inngangsdata til utdata på en automatisk måte.

Språkmodeller tar eksempeltekst, for eksempel dikt, og forvandler dem til en poengsum som oppsummerer ords beslektelse i frekvensen av deres medforekomst, så vel som mange andre målbare ting som frekvensen av lyder og stavetall.

Også: AI på seksti sekunder

På den måten utfører AI en data komprimeringshandling, komprimerer hele biblioteker i økonomiske statistikkbunter. Handlingen med dekompresjon rekonstruerer de formelle mønstrene for språket i den genererte teksten.

Det som slipper unna en slik prosess er en annen type komprimering, den menneskelige dikterens komprimering av assosiasjoner i langt større skala. Poesi spiller rundt kanten av ting, og det som ikke er sagt, er det som er i stand til å dukke opp.

Her er Romeo og Julia som romanserer hverandre med ordspill:

ROMEO: Hvis jeg vanhelger med min uverdigeste hånd
Denne hellige helligdommen, er den milde synden dette
Mine lepper, to rødmende pilegrimer, klare stå
For å glatte den tøffe berøringen med et mildt kyss

JULIET: God pilegrim, du gjør feil for mye på hånden din,
Hvilken hengivenhet viser seg i dette;
For helgener har hender som pilegrimshender berører,
Og håndflate til håndflate er hellig palmers kyss.

Linjene inneholder ikke bare det formelle forholdet mellom lyd og bilder i den interne strukturen. De inneholder også leken å snu ideer, om dem fra forskjellige vinkler, bryte dem som lys.

Om det kan fanges opp i en statistisk modell, kanskje en mer sofistikert, er et interessant spørsmål. Men akkurat nå savner det nyeste innen AI innen poenget.

Giveaway er måten AI-forskere snakker om deres bestrebelser. De forskjellige språkalgoritmene jobber alle med “problemet med diktgenerering”, som et papir uttrykker det. Men generasjon er sannsynligvis feil begrep.

I sine brev til en ung dikter skrev Rilke om viktigheten av ensomhet som noe som fjerner verdens virksomhet og tydeliggjør det som er viktig.

Tenk igjen på første linje i Rilkes Duino Elegies:

Wer, wenn ich schriee, hörte mich denn aus der Engel Ordnungen?

Hvem, hvis jeg gråt, ville høre meg blant englenes hierarki?

Forfatteren William Gass har sagt at Rilke ikke genererte elegiene så mye som mottok dem.

“Duino-elegiene ble ikke skrevet,” observerer William Gass, “de ble avventet”, “som kritikeren Lewis Hyde siterer ham. (Gass sa selv at hans opptatthet med formelle kvaliteter ved å skrive var en infantil fase, et hinder. “Først da jeg var klar til å komme ut av min formelle fase, begynte jeg å lese Rilke,” har han sagt.)

Den menneskelige dikteren, snarere enn å være en transformasjonsmaskin, er noe mer som en finjustert antenne, som tar opp det som allerede er der ute. Ensomheten som Rilke refererte til, tillater den slags oppmerksomhet.

AI, som en transformasjonsmaskin, løper i motsatt retning av ensomhet, stille, stillhet. AI frykter på en måte et vakuum. Målet er å rekonstruere total informasjon, Big Data. Oftere enn ikke kan automatisk språk ikke hjelpe å legge til flere ting.

Noen AI-studier anerkjenner åpent ulempene med bare replikerende formelle kvaliteter. En studie av IBM-forskere i 2018, kalt Deep-Speare, ba menneskemengdearbeidere om å bedømme om en Shakespeare-sonett faktisk var av The Bard eller var maskingenerert.

Mens mange dikt ved maskinen ble bedømt som vellykkede på formell grunnlag – rim og måler, si – menneskemengdearbeidere fant dikt misfornøyd med hensyn til emosjonell innvirkning. Det gjorde også en professor i engelsk, Adam Hammond fra University of Toronto.

Som forfatterne skriver,

Til tross for utmerket form, kan produksjonen av modellen vår lett skille seg fra menneskeskrevet poesi på grunn av dens lavere emosjonelle innvirkning og lesbarhet. Spesielt er det bevis her for at vårt fokus på form faktisk skader lesbarheten til de resulterende diktene.

Likevel vil AIs forkjærlighet for overbelastning av informasjon bare øke etter hvert som flere forskere underkaster menneskelig poesi for analytiske teknikker som bruker massive undersøkelser av tekster, som deretter kan kuttes og skjæres i terninger.

For eksempel samlet Thomas Nikolaus Haider fra Universitetet i Stuttgart, og Steffen Eger fra Technical University, Darmstadt, i 2019 et korpus med 75 000 dikt på tysk av 269 forfattere, fra 1500-tallet til i dag . Det er “det hittil største poesikorpuset”, bemerker de.

Forfatterne analyserte “troper” i diktene, betydningen, mønstre for å uttrykke et gitt konsept i språk som kommer igjen – nok en gang ting som kan kvantifiseres.

Ved hjelp av en kjent maskinlæringsteknikk, hvor sidestillinger av ord får en numerisk poengsum, fant forfatterne at troper som uttrykket “kjærlighet er magi” har økende forekomst i den tyske romantiske perioden, det 18. og 19. århundre. De sammenligner det med setninger som har avtagende valuta, for eksempel “kjærlighetens trommer.”

Poenget er at studien av poesistatistikken, muliggjort av store datasamlinger og nye analytiske verktøy, støtter følelsen av at det er mønstre, i det minste formelle mønstre, som ligger til grunn for den kreative impulsen , og at det derfor må være noe som kan fanges opp av riktig program.

Hovedlinjen for alt dette er at de fleste mennesker ser ut til å være i stand til å se forskjellen mellom maskinens skriving og en persons, og hvis de i det hele tatt kan fortelle, bryr de seg ikke nødvendigvis.

I en artikkel i januar, med underholdende tittel “Kunstig intelligens versus Maya Angelou: Eksperimentelt bevis på at folk ikke kan skille AI-generert fra menneskeskrevet poesi,” Nils Köbis og Luca D. Mossink fra Universitetet i Amsterdam og Max Planck-instituttet ba folk velge hva de foretrakk blant to dikt som hver begynte med samme linje, ett fullført av en person og ett fullført av GPT-2.

På tvers av flere forskjellige testoppsett fant forfatterne at “mennesker ikke er pålitelige i stand til å identifisere menneskelig kontra algoritmisk kreativt innhold.”

Dessuten viste mange at de hadde det bra med de maskinopprettede diktene, selv når de ble fortalt på forhånd at de leste arbeidet til en algoritme.

I en annen studie genererte Andrea Zugarini og kollegaer ved Universitetene i Firenze og Siena i 2019 tercets, en tre-linjers enhet i et dikt, og utfordret mennesker til å fortelle dem fra Dante Alighieris egne tercets i sitt poetiske mesterverk The Divine Comedy.

Naive menneskelige dommere, de uten spesiell bakgrunn i Dante-studier, dømte de genererte tercets til å være virkelig skrevet av Dante nesten halve tiden, i utgangspunktet en myntkast. Dante-eksperter klarte seg bedre.

Zugarini og kollegaer konkluderer med at deres arbeid er i stand til å “holde Divine Comedy's meter og rim” selv om det mislykkes i andre henseender.

Når forskere blir bedre og bedre til å konstruere slike formelle evalueringer, der mennesker er villige til å akseptere en gyldig maskin som tilnærmer seg overfladiske kvaliteter, kan bekymringene til menneskelig kunst forsvinne.

Derfor kan en slags gullalder for menneskelig og AI-samarbeid bli satt til å utfolde seg, med kuppler, terceter og kvatriner som eksploderer på scenen raskere enn du kan si

så mye avhenger

av

et rødt hjul

barrow

må lese

 Ethics of AI: Benefits and risks of artificial intelligence

Etikk ved AI: Fordeler og risikoer ved kunstig intelligens

Den økende omfanget av AI øker innsatsen for store etiske spørsmål.

Les mer

Relaterte emner:

Digital Transformation CXO Internet of Things Innovasjon Enterprise Software Smart Cities  Tiernan Ray

Av Tiernan Ray | 3. juni 2021 – 14:13 GMT (15:13 BST) | Tema: Kunstig intelligens