AI skriver stadig elendig poesi

0
117

 Tiernan Ray

Af Tiernan Ray | 3. juni 2021 – 14:13 GMT (15:13 BST) | Emne: Kunstig intelligens

Hendes øjne, to bassiner af mystisk lys,
Evigt i hendes udstråling hvid—,
Hun søgte nattens bryst.
væk kom det, det mystiske syn!

– Anonym menneskelig forfatter i samarbejde med poesialgoritme

En undersøgelse af nyere litteratur i maskinindlæringskategorien kunstig intelligens viser stadige fremskridt i udviklingen af ​​teknikker til automatisk generering af poesi.

Outputtet forbliver temmelig middelmådigt, men det bliver godt nok, at nogle menneskelige læsere vil give digtene respektable karakterer i kontrollerede evalueringer. Og nogle mennesker vil endda blive narret til at tilskrive menneskeligt forfatterskab til maskinpoesi.

Mens det væsentlige ved den mest sublime form for menneskelig skrivning undgår AI, er softwaren dygtig nok til at generere faxer, der kan bestå en test.

Digtet, der er anført øverst i denne artikel, blev delvist oprettet af en maskine. Et Google-softwareprogram, kaldet Vers by Verse, der blev introduceret i marts, tager et stykke input fra et menneske, den første tekstlinje, Hendes øjne, tvillingepuljer af mystisk lys. Derefter fortsætter strofe og producerer automatisk de efterfølgende tre linjer.

Dette kvatrain, som det kaldes, blev positivt betragtet af folkemængdearbejdere, som Google hvervede til at sammenligne de menneskelige plus-maskin-kreationer med digte skrevet udelukkende af et menneske. Programmet og evalueringerne er beskrevet i introduktionen af ​​Google-forskere David Uthus, Maria Voitovich og R.J. Mical.

Vers for Verses evne til at producere tekst er et resultat af, at programmet har indtaget et korpus med toogtyve forskellige digters arbejde. På programmets websted opfordres en bruger til at vælge op til tre af de berømte digtere som “muses” for at færdiggøre et digt, som brugeren leverer den første linje til.

Resultaterne er et morsomt salonspil og et elendigt digt. Her er hvad der sker, når vers for vers får den første linje i Rainer Maria Rilkes Duino-elegier:

 von-rilke-mit digt.

Firelinjens output kræver, at brugeren vælger blandt flere foreslåede linjer genereret af algoritmen, og hver linje er betinget af at være i en af ​​de tre valgte digters vene. Mens nogle andre kombinationer kunne være mere ønskelige – valg og mulighed er signaturelementer i automatisk tekst – er det usandsynligt, at nogen banebrydende vers ville dukke op selv med mange forsøg.

 vers af -vers-poesi-arkitektur-juni-2021.jpg

Digtningsmaskinen: Googles vers for vers tager et krop af arbejde som input for at træne et transformator neuralt netværk til generering af tekst generelt, og derefter kan den endelige output fra enhver brugersession være betinget af inputprøver af specifikke digtere.

Vers for Verse er et eksempel på en tendens i løbet af det sidste årti blandt AI-lærde i den akademiske verden og forskere hos Google og andre store virksomheder til at forfine maskinindlæringsprogrammer, der enten genererer et helt nyt arbejde eller udvider et sætningsinput fra en person.

Værkerne bruger alle de såkaldte sprogmodeller, programmer, der bruger maskinindlæring til at opbygge en statistisk repræsentation af, hvordan ord typisk falder sammen i en sætning. Den paradigmatiske sprogmodel er GPT-3, et program, der blev udgivet sidste år af San Francisco-startup OpenAI, der har taget verden med storm.

Mange kommentatorer er blevet slået af den tilsyneladende menneskelige tekst i GPT-3. New Yorker's Stephan Marche har skrevet, at GPT-3 kan skrive ligesom Franz Kafka, idet han citerer et uddrag af metamorfosen, der er omskrevet af GPT-3.

Også: Hvad er GPT-3? Alt, hvad din virksomhed har brug for at vide om OpenAIs banebrydende AI-sprogprogram

Faktisk lyder redux virkelig ikke som originalen. Men Marche og andre har fanget den største præstation af GPT-3 og andre sprogmodeller, som er at replikere overfladekvaliteterne af ordkombinationer, som kan omfatte stilistisk emulering.

Poesi har været et populært valg for at skubbe grænserne for, hvad sådanne sprogmodeller kan fange, fordi mest poesi er præget af formelle kvaliteter, der kan måles statistisk, herunder måler, rimskema og assonans.

Nyligt arbejde med AI-poesi søger at efterligne disse formelle elementer med stigende strenghed.

Kevin Yang og Dan Klein fra U.C. Berkeley offentliggjorde i april et papir om deres opfindelse, kaldet FUDGE, som automatisk kan generere den anden linje af Shakespeares koblinger, der spontant replikerer iambisk pentameter, det stressmønster, som Shakespeare anvendte så effektivt.

Hvad der dukker op er klodsede koblinger, men anstændig formalisme. Her er Shakespeares originale sonnet nummer 48:

Hvor forsigtig var jeg, da jeg tog min vej,
Hver bagatel under sandeste stænger at skyde,
At det til min brug kan være ubrugt ophold
Fra falskhedens hænder, helt sikkert tillidsafdelinger!
Men du, for hvem mine juveler er små ting,
Mest værdig trøst, nu min største sorg,
Du bedst af kæreste, og min eneste pleje,
Art efterlod enhver vulgær tyvs bytte.
Dig har jeg ikke låst inde i nogen brystkasse,
Spar hvor du ikke er, skønt jeg føler at du er,
I mit blide lukning af mit bryst,
Hvorfra du kan komme og komme del;
Og selv derfra vil du være stol'n, frygter jeg,
For sandheden viser sig at være tyv for en pris så kær.

I FUDGE tager Yang og Klein den første linje i afslutningskoblingen, og selv derfra vil du være stol'n, frygter jeg, og få programmet til at skrive en ny anden linje. Det, der kommer ud, er ikke så poetisk og bærer intet spor af sonettens udvidede metaforer:

Og selv derfra vil du være stol'n, frygter jeg,
for dette skal være slutningen. Det er ret klart.

Teknologisk set er FUDGE en tour de force. Yang og Klein har taget GPT-3s forgænger fra 2019, GPT-2, og tweaked det. (GPT-2 kan downloades, hvilket gør det til et populært valg til sprogmodeludvikling, i modsætning til GPT-3, hvis brug er begrænset af OpenAI.)

GPT-2 og GPT-3 gør ikke ved noget om iambisk pentameter, de aber blot, hvilken slags stil de får. Ved at tilføje nogle kodelinjer var Yang og Klein i stand til at tvinge FUDGE til pålideligt at holde sig til iambic. Derfor opfylder FUDGE-koblinger en stilistisk forpligtelse på en konsekvent måde.

Yang og Klein, til deres ære, er under ingen illusioner om kvaliteten af ​​den genererede koblet. “Shakespeare er kun inkluderet som et lunefuldt referencepunkt,” skriver de, “vores generationer holder naturligvis ikke et lys til Shakespeares originaler.”

Når maskindigte falder fladt, er det desto mere tydeligt inden for en meget bestemt formel tradition. Tag limericks, de elskede digter med fem linier, der har et ensartet arrangement af stavelser og et konsekvent rimskema.

Michael Palin, fra Monty Python-berømmelse, har tilbudt limericks af sin egen skabelse:

De sagde om en jordemoder ved navn Paula,
Hvis der var nogen problemer, så ring bare til hende.
Hendes færdigheder i vandet
Hun lærte af en portier
Hvem leverede fisk fersk fra en trawler.

Uanset om sådanne digte er sjove eller ikke, og det skal de generelt være, har de normalt en komplet idé, der afspilles i de fem linjer med en slags twist eller overraskende tur, der er designet til at producere glæde.

For at forsøge automatisk at generere limericks debuterede Jianyou Wang og kolleger ved Duke University i marts LimGen. LimGen bruger det, der kaldes en skabelon, et sæt regler for, hvordan limerick-linjer dannes, såsom et emne plus et verbum plus et objekt. Det er baseret på 300 limericks som eksempler, et relativt lille udvalg.

Wang og team tilføjer til skabelonen en anden algoritme, populær i sprogmodeller, kaldet en strålesøgning. Det scorer automatisk teksten, der er genereret af skabelonprogrammet, for at vælge den bedste output som en slags stemmeautoritet.

Resultaterne i et fornuft fungerer ved at føle at de minder om limericks, men der er noget fladt ved dem:

Der var en ærlig mand ved navn Dwight
der mistede alt hans penge i en kamp.
Hans venner var så ked af det,
De var villige til at satse,
Og de kunne ikke lide følelse af trods.

Der var en høj servitrice ved navn Jacque, som hældte al sin kaffe i en ryste.
Men det øjeblik hun rørte,
Hun blev ramt af en fugl,
Så så hun den flyve mod søen.

Selvom der er nogenlunde kontinuitet i disse limericks, er der en mærkelig opløsning mod slutningen af ​​hver strofe, som om idéens udvikling er overgivet til de formelle begrænsninger.

 wang-et-al -limgen-architecture-2021.jpg

Limerick-maskinen: En skabelon samler sætninger, der automatisk matcher kendte begrænsninger for, hvad hver linje af en limerick skal være, og derefter vælger en automatisk søgefunktion, kaldet beam search, de bedste kandidatlinjer.

Wang et al.

I betragtning af de utilfredsstillende resultater af rå output vil flere programmer sandsynligvis efterligne Googles menneskelige samarbejde i vers for vers.

Det sædvanlige udtryk i AI for den samlede indsats er menneske-i-løkken. En slående inversion, der er opstået, er “computer-in-the-loop”.

Imke van Heerden og Anil Bas, lærde fra Koç ̧University og Marmara University i Istanbul, debuterede i marts en computer-in-the-loop tilgang til at verve mennesker til effektivt at redigere en maskindannet tekst til et digt. De fokuserer på Afrikaans, et af de officielle sprog i Sydafrika og andre lande i regionen, et sprog der ikke traditionelt har fået meget opmærksomhed i AI-sprogmodeller.

Van Heerden og Bass sprogmodelprogram kaldet AfriKI for “Afrikaanse Kunsmatige Intelligensie”, afrikansk kunstig intelligens, forsøger udtrykkeligt at forbedre, snarere end at fortrænge, ​​menneskeligt arbejde.

“Mens [naturlig sproggenerering] i sin søgen efter fuld automatisering kan rynke panden efter menneskelig involvering, gør vores menneskecentrerede ramme det modsatte,” skriver de.

“Denne undersøgelse viser, at menneske-maskinsamarbejde kan forbedre menneskelig kreativitet.”

AfriKI indtager alle 208.616 ord i en enkelt afrikansk-sprogroman, Die Biblioteek aan die Einde van die Wêreld (Et bibliotek ved verdens ende) af Etienne van Heerden.

I en proces, der ligner Googles vers for vers, genererer AfriKI hundreder af prosa-sætninger, og mennesket vælger, hvilke sætninger de skal bruge, og i hvilken rækkefølge de skal samles i en strofe.

Resultatet er korte stykker, der har nogle levende billeder og nogle interessante anvendelser af metafor:

Die konstabel se skiereiland

Afrika drikker
onheil i die vand.
Die landskap kantel sy rug
in sigbewaking en vlam.
Ons oopgesnyde skyld
brandtrappe for den anden stat.
Dette grundord intimidering.

Konstabelens halvø

Afrika drikker
katastrofe i vandet.
Landskabet vipper ryggen
i overvågning og flamme.
Vores afskårne anliggender
ild undslipper for andre stater.
Denne jord bliver intimidering.

Som forfatterne bemærker, er der nok figurativt sprog og metafor her til at minde om nogle poesiskoler. “Sproget kan beskrives som minimalistisk, stemningsfuldt og abstrakt, og derfor åbent for fortolkning, der ligner imagistisk og surrealistisk poesi.”

Op til et punkt. Digtene ser stadig ud til at være mest farvet med farver, penselstrøg uden at have en idé.

Det er let at se den fælles faldgrube, som alle sprogmodeller bukker under. Maskinindlæringsprogrammer er transformationsmaskiner: deres nytte er at omdanne nogle inputdata til output på en automatisk måde.

Sprogmodeller tager eksemplet på tekst, såsom digte, og omdanner dem til en score, der opsummerer ords sammenhæng i hyppigheden af ​​deres co-forekomst såvel som mange andre målbare ting som hyppigheden af ​​lyde og stavelse.

Også: AI på tres sekunder

På den måde udfører AI en data komprimeringshandling, komprimering af hele biblioteker til økonomiske bundter med statistik. Handlingen med dekompression rekonstruerer de formelle sprogmønstre i den genererede tekst.

Hvad der undgår en sådan proces er en anden form for kompression, den menneskelige digters komprimering af foreninger i langt større skala. Poesi spiller rundt om tingenes kanter, og det, der ikke siges, er det der er i stand til at dukke op.

Her romantiserer Romeo og Julia hinanden med ordspil:

ROMEO: Hvis jeg vanhelger med min uværdige hånd
Denne hellige helligdom, er den blide synd dette
Mine læber, to rødmende pilgrimme, klar stand
For at udjævne det hårde strejf med et blidt kys

JULIET: God pilgrim, du tager forkert i din hånd for meget,
Hvilken hengivenhed viser sig i dette;
For helgener har hænder, som pilgrimshænder ikke rører ved,
Og håndflade til håndflade er hellig palmers kys.

Linjerne indeholder ikke kun det formelle forhold mellem lyd og billedsprog i den interne struktur. De indeholder også leget med at vende ideer om dem fra forskellige vinkler og bryde dem som lys.

Om det kan fanges i en statistisk model, måske en mere sofistikeret, er et interessant spørgsmål. Men lige nu går det højeste niveau inden for kunst i AI.

Giveaway er den måde, AI-forskere taler om deres bestræbelser på. De forskellige sprogalgoritmer arbejder alle på “problemet med digtgenerering”, som et papir udtrykker det. Men generation er sandsynligvis det forkerte udtryk.

I sine breve til en ung digter skrev Rilke om vigtigheden af ​​ensomhed som noget, der fjerner verdens forretning og gør det klart, hvad der er vigtigt.

Overvej igen første linje i Rilkes Duino-elegier:

Wer, wenn ich schriee, hörte mich denn aus der Engel Ordnungen?

Hvem, hvis jeg græd, ville høre mig blandt englenes hierarki?

Romanforfatteren William Gass har sagt, at Rilke ikke genererede elegierne så meget som at modtage dem.

“Duino-elegierne blev ikke skrevet,” bemærker William Gass, “de blev afventet”, “som kritikeren Lewis Hyde citerer ham. (Gass sagde selv, at hans optagelse med formelle kvaliteter ved at skrive var en infantil fase, en hindring. “Først da jeg var klar til at komme ud af min formelle fase, begyndte jeg at læse Rilke,” har han sagt.)

Den menneskelige digter er snarere end at være en transformationsmaskine noget mere som en finjusteret antenne, der opfanger det, der allerede er derude. Ensomheden, som Rilke henviste til, tillader den slags opmærksomhed.

AI, som en transformationsmaskine, kører i den modsatte retning af ensomhed, stille, stilhed. AI frygter på en måde et vakuum. Dens mål er at rekonstruere total information, Big Data. Oftere end ikke kan automatisk sprog ikke hjælpe med at tilføje flere ting.

Nogle AI-undersøgelser anerkender åbent ulemperne ved blot replikerende formelle kvaliteter. En undersøgelse foretaget af IBM-forskere i 2018, kaldet Deep-Speare, bad menneskemængdearbejdere om at bedømme, om en Shakespeare-sonet faktisk var af The Bard eller var maskingenereret.

Mens mange digte ved maskinen blev bedømt som vellykkede på formelle grunde – rim og måler, siger – menneskelige menneskearbejdere fandt digte utilfredse med hensyn til følelsesmæssig indvirkning. Det gjorde også en professor i engelsk, Adam Hammond fra University of Toronto.

Som forfatterne skriver,

På trods af fremragende form kan produktionen af ​​vores model let skelnes fra menneskeskrevet poesi på grund af dens lavere følelsesmæssige indflydelse og læsbarhed. Især er der beviser her for, at vores fokus på form faktisk skader læsbarheden af ​​de resulterende digte.

Ikke desto mindre vil AIs forkærlighed for overbelastning af information kun stige, efterhånden som flere forskere udsætter menneskelig poesi for analytiske teknikker, der anvender massive undersøgelser af tekster, som derefter kan opdeles og skæres i terninger.

F.eks. sammensatte Thomas Nikolaus Haider fra universitetet i Stuttgart og Steffen Eger fra det tekniske universitet i Darmstadt i 2019 et korpus med 75.000 digte på tysk af 269 forfattere fra det 16. århundrede til i dag . Det er “det hidtil største poesikorpus”, bemærker de.

Forfatterne analyserede “troperne” i digtene, hvilket betyder mønstre til at udtrykke et givet koncept på sprog, der gentager sig – igen ting, der kan kvantificeres.

Ved hjælp af en velkendt maskinindlæringsteknik, hvor sidestillinger af ord får en numerisk score, fandt forfatterne, at troper som udtrykket “kærlighed er magi” har stigende udbredelse i den tyske romantiske periode, det 18. og 19. århundrede. De sammenligner det med sætninger, der har faldende valuta, såsom “kærlighedens trommer”.

Pointen er, at studiet af poesistatistikker muliggjort af store datasamlinger og nye analytiske værktøjer understøtter følelsen af, at der er mønstre, i det mindste formelle mønstre, der ligger til grund for den kreative impuls , og at der derfor skal være noget, der kan fanges af det relevante program.

Hovedlinjen til alt dette er, at de fleste mennesker ikke synes at være i stand til at fortælle forskellen mellem maskinens skrivning og en persons, og hvis de overhovedet kan fortælle, er de ikke nødvendigvis ligeglade.

I en artikel i januar med en underholdende titel “Kunstig intelligens versus Maya Angelou: Eksperimentelt bevis for, at folk ikke kan skelne AI-genereret fra menneskeskrevet poesi,” Nils Köbis og Luca D. Mossink fra University of Amsterdam og Max Planck-instituttet bad folk vælge, hvilket de foretrak blandt to digte, der hver begyndte med samme linje, et udfyldt af en person og et udfyldt af GPT-2.

På tværs af flere forskellige testopsætninger fandt forfatterne, at “folk ikke pålideligt er i stand til at identificere menneskeligt versus algoritmisk kreativt indhold.”

Desuden viste mange mennesker, at de var helt fine med de maskindannede digte, selv når de fik besked på forhånd, at de læste en algoritmes arbejde.

I en anden undersøgelse genererede Andrea Zugarini og kolleger ved Universiteterne i Firenze og Siena i 2019 tercets, en enhed med tre linjer i et digt, og udfordrede mennesker til at fortælle dem fra Dante Alighieris egne tercets i hans poetiske mesterværk The Divine Comedy.

Naive menneskelige dommere, dem uden særlig baggrund i Dante-studier, vurderede, at de genererede terceter virkelig var skrevet af Dante næsten halvdelen af ​​tiden, dybest set en møntkast. Dante-eksperter klarede sig bedre.

Zugarini og kolleger konkluderer, at deres arbejde er i stand til at “holde guddommelig komedies måler og rim”, selvom det fejler i andre henseender.

Efterhånden som forskere bliver bedre og bedre til at konstruere sådanne formelle evalueringer, hvor mennesker er villige til at acceptere som en gyldig maskine, der tilnærmer sig overfladiske kvaliteter, kan menneskets kunst bekymre sig.

Derfor kan en slags gylden tidsalder for menneskeligt og AI-samarbejde indstilles til at udfolde sig, med koblinger, terceter og kvatriner, der eksploderer hurtigere på scenen, end du kan sige

så meget afhænger

af

et rødt hjul

barrow

skal læse

 Etik ved AI: Fordele og risici ved kunstig intelligens

Etik ved AI: Fordele og risici ved kunstig intelligens

Det stigende omfang af AI hæver indsatsen for større etiske spørgsmål.

Læs mere

Relaterede emner:

Digital transformation CXO Internet of Things Innovation Enterprise Software Smart Cities  Tiernan Ray

Af Tiernan Ray | 3. juni 2021 – 14:13 GMT (15:13 BST) | Emne: Kunstig intelligens