Hennes ögon, dubbla pooler av mystiskt ljus,
för evigt i sin utstrålning vita—,
Hon sökte nattens barm.
Bort kom det, den mystiska synen!– Anonym mänsklig författare i samarbete med poesialgoritm
En undersökning av ny litteratur i maskininlärningskategorin artificiell intelligens visar stadiga framsteg i utvecklingen av tekniker för att automatiskt generera poesi.
Produktionen förblir ganska medioker, men det blir tillräckligt bra för att vissa mänskliga läsare kommer att ge dikterna respektabla betyg i kontrollerade utvärderingar. Och vissa människor kommer till och med att luras till att tillskriva mänsklig författarskap till maskinpoesi.
Medan det väsentliga i den mest sublima formen av mänsklig skrivning undgår AI, är programvaran tillräckligt skicklig för att generera fax som kan klara ett test.
Dikten som listas högst upp i denna artikel skapades delvis av en maskin. Ett Googles programvara, kallat Verse by Verse, som introducerades i mars, tar en del av inmatningen från en människa, den första textraden, Hennes ögon, två pooler av mystiskt ljus. Därefter fortsätter strofe och producerar automatiskt de efterföljande tre raderna.
Detta kvatrain, som det heter, betraktades positivt av folkmassearbetare som Google anlitade för att jämföra skapelserna mellan människor och maskiner med dikter skrivna helt av en människa. Programmet och utvärderingarna beskrivs i inledningen av Googles forskare David Uthus, Maria Voitovich och R.J. Mical.
Verse by Verses förmåga att producera text är ett resultat av att programmet har intagit en korpus med tjugotvå olika dikters arbete. På programmets webbplats uppmanas en användare att välja upp till tre av de berömda poeterna som “muses” för att slutföra en dikt för vilken användaren levererar den första raden.
Resultaten är ett underhållande salongspel och en usel dikt. Här är vad som händer när Verse by Verse matas in i första raden av Rainer Maria Rilkes Duino Elegies:
Fyrradersutgången kräver att användaren väljer bland flera föreslagna linjer som genereras av algoritmen, varvid varje rad är villkorad av en av de tre valda poeterna. Medan vissa andra kombinationer kan vara mer önskvärda – val och möjlighet är signaturelement i automatisk text – är det osannolikt att någon banbrytande vers skulle dyka upp även med många försök.
Poesiemaskinen: Googles vers för vers tar in en massa arbeta som inmatning för att träna ett transformatorneuralt nätverk för att generera text i allmänhet, och sedan kan den slutliga utgången från vilken användarsession som helst konditioneras på ingångsprover från specifika poeter.
Uthus et al.
Verse by Verse är ett exempel på en trend under det senaste decenniet bland AI-forskare i den akademiska världen, och forskare på Google och andra stora företag, att förfina maskininlärningsprogram som antingen genererar ett helt nytt arbete eller utvidgar en frasinmatning av en person.
Verken använder alla så kallade språkmodeller, program som använder maskininlärning för att bygga en statistisk representation av hur ord vanligtvis faller ihop i en mening. Den paradigmatiska språkmodellen är GPT-3, ett program som släpptes förra året av OpenAI i San Francisco som har tagit världen med storm.
Många kommentatorer har blivit helt slagen av den till synes mänskliga texten i GPT-3. New Yorker's Stephan Marche har skrivit att GPT-3 kan skriva som Franz Kafka, med hänvisning till ett utdrag av Metamorphosis omskrivet av GPT-3.
Också: Vad är GPT-3? Allt ditt företag behöver veta om OpenAI: s banbrytande AI-språkprogram
Faktum är att redux verkligen inte låter som originalet. Men Marche och andra har tagit fast på den främsta uppnåendet av GPT-3 och andra språkmodeller, vilket är att replikera ytkvaliteterna för ordkombinationer, som kan inkludera stilistisk emulering.
Poesi har varit ett populärt val för att driva gränserna för vad sådana språkmodeller kan fånga eftersom de flesta poesi präglas av formella kvaliteter som kan mätas statistiskt inklusive mätare, rimschema och assonans.
Senaste arbetet med AI-poesi syftar till att efterlikna dessa formella element med ökande noggrannhet.
Kevin Yang och Dan Klein från U.C. Berkeley publicerade i april ett papper om deras uppfinning, kallat FUDGE, som automatiskt kan generera den andra raden av Shakespeares par, spontant replikera iambisk pentameter, det stressmönster som Shakespeare använde så effektivt.
Vad som dyker upp är klumpiga par men anständig formalism. Här är Shakespeares ursprungliga sonett nummer 48:
Hur försiktig var jag när jag tog min väg,
Varje bagatell under de sanna stavarna att trycka på,
Att det till min användning kan vara oanvänd vistelse
Från falskhetens händer, i själva verket av tillit!
Men du, för vilka mina smycken är små,
Mycket värdig tröst, nu min största sorg,
Du bästa av käraste, och min enda bryr mig,
Art lämnade bytet av varje vulgär tjuv.
Du har jag inte låst i något bröst,
Spara där du inte är, även om jag känner att du är,
Inom den mjuka stängningen av mitt bröst,
Från varifrån jag kan komma och komma del;
Och även därifrån kommer du att bli stol'n, fruktar jag, för sanningen visar sig vara tjuv för ett så kära pris.
I FUDGE tar Yang och Klein första raden i avslutningskopplingen, och även därifrån kommer du att bli stol'n, fruktar jag, och låta programmet skriva en ny andra rad. Det som kommer ut är inte lika poetiskt och bär inget spår av sonettens förlängda metaforer:
Och även därifrån kommer du att bli stol'n, fruktar jag,
för detta ska vara slutet. Det är ganska tydligt.
Tekniskt sett är FUDGE en tour de force. Yang och Klein har tagit GPT-3s föregångare från 2019, GPT-2, och justerat den. (GPT-2 finns att ladda ner, vilket gör det till ett populärt val för språkmodellutveckling, till skillnad från GPT-3, vars användning är begränsad av OpenAI.)
GPT-2 och GPT-3 gör inte vet någonting om iambisk pentameter, de apa bara vilken typ av exempel de får. Genom att lägga till några rader kod kunde Yang och Klein tvinga FUDGE att på ett tillförlitligt sätt hålla sig till iambic. Följaktligen uppfyller FUDGE-kopplingar en stilistisk skyldighet på ett konsekvent sätt.
Yang och Klein, till deras kredit, är inte under några illusioner om kvaliteten på den genererade kopplingen. “Shakespeare ingår bara som en nyckfull referenspunkt”, skriver de, “våra generationer håller uppenbarligen inte ett ljus till Shakespeares original.”
När maskindikter faller platt är det desto mer uppenbart inom en mycket speciell formell tradition. Ta limericks, de älskade femradiga dikterna som har ett konsekvent arrangemang av stavelser och ett konsekvent rimschema.
Michael Palin, av Monty Pythons berömmelse, har erbjudit limericks av sin egen skapelse:
De sa om en barnmorska som heter Paula,
Om det var några problem så ring henne bara.
Hennes färdigheter i vattnet
Hon lärde sig av en portier
Vem levererade fisk, färsk, av en trålare.
Oavsett om sådana dikter är roliga eller vanligtvis ska de ha det, har de vanligtvis en fullständig idé som spelas ut i de fem raderna, med en slags twist eller överraskande tur som är utformad för att ge glädje.
För att försöka automatiskt skapa limericks debuterade Jianyou Wang och kollegor vid Duke University i mars LimGen. LimGen använder det som kallas en mall, en uppsättning regler för hur limerick-linjer bildas, till exempel ett ämne plus ett verb plus ett objekt. Det är baserat på 300 limericks som exempel, ett relativt litet urval.
Wang och team lägger till mallen en annan algoritm, populär i språkmodeller, kallad strålsökning. Den scorer automatiskt texten som genereras av mallprogrammet för att välja den bästa utdata, som en slags röstningsmyndighet.
Resultatet blir en känsla av att känna påminner om limericks, men det finns något platt med dem:
Det var en ärlig man vid namn Dwight
Som förlorade allt hans pengar i en strid.
Hans vänner var så upprörda,
De var villiga att satsa,
Och de tyckte inte om känslan av trots.Det fanns en hög servitris som heter Jacque,
som hällde allt kaffe i en skakning.
Men när hon rörde sig,
Hon slogs av en fågel,
Sedan såg hon den flyga mot sjön.
Även om det, ungefär, finns kontinuitet i dessa limericks, finns det en konstig upplösning mot slutet av varje strofe, som om idéens utveckling har överlämnats till de formella begränsningarna.
Limerick-maskinen: En mall samlar meningar som automatiskt matchar kända begränsningar för vad varje rad av en limerick bör vara, och sedan väljer en automatisk sökfunktion, kallad strålsökning, de bästa kandidatraderna.
Wang et al.
Med tanke på de otillfredsställande resultaten av råproduktion kommer fler program förmodligen att efterlikna Googles mänskliga samarbete i Verse by Verse.
Den vanliga termen i AI för den kombinerade ansträngningen är mänsklig i ögat. En slående inversion som har dykt upp är “dator-i-öglan”.
Imke van Heerden och Anil Bas, forskare från Koç ̧University och Marmara University i Istanbul, debuterade i mars en dator-in-the-loop-metod för att få människor att effektivt redigera en maskingenererad text till en dikt. De fokuserar på afrikaans, ett av de officiella språken i Sydafrika och andra länder i regionen, ett språk som traditionellt inte har fått mycket uppmärksamhet i AI-språkmodeller.
Van Heerden och Bas: s språkmodellprogram, kallat AfriKI, för “Afrikaanse Kunsmatige Intelligensie”, afrikansk artificiell intelligens, försöker uttryckligen förbättra, snarare än förtränga, mänskligt arbete.
“Medan [naturligt språkgenerering] i sin strävan efter fullständig automatisering kan rynka pannan på mänskligt engagemang, gör vårt mänskligt centrerade ramverk tvärtom”, skriver de.
“Denna studie visar att samarbete mellan människor och maskiner kan förbättra mänsklig kreativitet.”
AfriKI tar in alla 208 616 ord i en enda afrikanskspråkig roman, Die Biblioteek aan die Einde van die Wêreld (Biblioteket i slutet av världen) av Etienne van Heerden.
I en process som verkar likna Googles vers för vers genererar AfriKI hundratals prosa-fraser, och människan väljer vilka fraser som ska användas och i vilken ordning de ska samlas till en strofe.
Resultatet är korta bitar som har några livfulla bilder och några intressanta användningsområden för metafor:
Die konstabel se skiereiland
Afrikadryck och onheil i vatten.
Die landskap kantel sy rug
in sigbewaking en vlam.
Ons oopgesnyde sake – brandtrappe vir the ander state.
Detta grundord intimidasie.
Konstabelns halvö
Afrika dricker en katastrof i vattnet.
Landskapet lutar ryggen
i övervakning och flamma.
Våra avskärda affärer
eld flyr för andra stater.
Denna jord blir hot.
Som författarna noterar finns det tillräckligt med figurativt språk och metafor här för att påminna om vissa skolor för poesi. “Språket kan beskrivas som minimalistiskt, stämningsfullt och abstrakt, och därför öppet för tolkning, som liknar Imagistisk och surrealistisk poesi.”
Upp till en punkt. Dikterna verkar fortfarande vara mest färgade med färger, penseldrag utan att ha en idé.
Det är lätt att se den vanliga fallgropen som alla språkmodeller ger efter. Maskininlärningsprogram är transformationsmaskiner: deras nytta är att omvandla vissa inmatade data till utdata på ett automatiserat sätt.
Språkmodeller tar exempeltexter, till exempel dikter, och förvandlar dem till ett partitur som sammanfattar ordens släkt i frekvensen av deras medförekomst, liksom många andra mätbara saker som ljudfrekvensen och stavningsräkningarna.
Också: AI på sextio sekunder
På det sättet utför AI en data komprimeringsåtgärd, komprimera hela bibliotek till ekonomiska statistikbuntar. Dekompressionen handlar om de formella språkmönstren i den genererade texten.
Det som undgår en sådan process är en annan typ av kompression, den mänskliga poetens kompression av associationer i mycket större skala. Poesi spelar runt kanterna på saker och det som inte sägs är det som därigenom kan dyka upp.
Här är Romeo och Julia som romansar varandra med ordspel:
ROMEO: Om jag vanhelgar med min ovärdiga hand
Denna heliga helgedom, är den milda synden detta
Mina läppar, två rodna pilgrimer, färdiga ställningar
För att jämna ut den grova beröringen med en mild kyssJULIET: Bra pilgrim, du gör din hand för fel,
Vilken hängivenhet visar sig i detta;
För heliga har händer som pilgrimshänder rör vid,
Och palm till palm är helig palmers kyss.
Raderna innehåller inte bara det formella förhållandet mellan ljud och bilder i den interna strukturen. De innehåller också spelet att vända på idéer, betrakta dem från olika vinklar, bryta dem som ljus.
Om det kan fångas i en statistisk modell, kanske en mer sofistikerad, är en intressant fråga. Men just nu missar toppmodern det senaste inom AI.
Utdelningen är det sätt som AI-forskare talar om sina ansträngningar. De olika språkalgoritmerna arbetar alla med “problemet med diktsgenerering”, som en uppsats uttrycker det. Men generation är förmodligen fel term.
I sina brev till en ung poet skrev Rilke om vikten av ensamhet som något som tar bort världens verksamhet och klargör vad som är väsentligt.
Tänk igen den första raden i Rilkes Duino-elegier:
Wer, wenn ich schriee, hörte mich denn aus der Engel Ordnungen?
Vem, om jag grät, skulle höra mig bland änglarnas hierarki?
Romanförfattaren William Gass har sagt att Rilke inte genererade eleganterna så mycket som att de fick dem.
“Duino-elegierna skrevs inte,” observerar William Gass, “de väntades på”, “som kritikern Lewis Hyde citerar honom. (Gass själv sa att hans upptagning med formella skrivkvaliteter var en infantil fas, ett hinder. “Det var inte förrän jag var redo att komma ut ur min formella fas att jag började läsa Rilke,” har han sagt.)
Den mänskliga poeten, snarare än att vara en transformationsmaskin, är något mer som en finjusterad antenn som tar upp det som redan finns där ute. Ensamheten som Rilke hänvisade till möjliggör den typen av uppmärksamhet.
AI, som en transformationsmaskin, kör i motsatt riktning av ensamhet, tystnad, tystnad. AI fruktar på ett sätt ett vakuum. Målet är att rekonstruera total information, Big Data. Ofta kan inte automatiskt språk hjälpa till att lägga till fler saker.
Vissa AI-studier erkänner öppet nackdelarna med att bara replikera formella kvaliteter. En studie av IBM-forskare 2018, som kallades Deep-Speare, bad mänskliga folkmassearbetare att bedöma om en Shakespeare-sonett faktiskt var av The Bard eller var maskingenererad.
Medan många dikter av maskinen bedömdes vara framgångsrika på formella grunder – rim och mätare, säg – mänskliga publikarbetare tyckte att dikter var otillfredsställande när det gäller emotionell påverkan. Så gjorde en professor i engelska, Adam Hammond från University of Toronto.
Som författarna skriver,
Trots utmärkt form kan produktionen av vår modell lätt särskiljas från mänsklig skriven poesi på grund av dess lägre emotionella inverkan och läsbarhet. I synnerhet finns det bevis här att vårt fokus på form faktiskt sår läsbarheten för de resulterande dikterna.
Ändå kommer AI: s förkärlek för överbelastning av information bara att öka eftersom fler forskare utsätter mänsklig poesi för analytiska tekniker som använder massiva undersökningar av texter, som sedan kan skivas och täras.
Till exempel sammanställde Thomas Nikolaus Haider vid universitetet i Stuttgart och Steffen Eger vid tekniska universitetet i Darmstadt 2019 en korpus med 75 000 dikter på tyska av 269 författare, från 1500-talet och fram till idag. . Det är “den hittills största poesikorpus”, konstaterar de.
Författarna analyserade “troperna” i dikterna, vilket betyder, mönster för att uttrycka ett givet koncept på språk som återkommer – återigen saker som kan kvantifieras.
Med hjälp av en välkänd maskininlärningsteknik, där sammansättningar av ord ges en numerisk poäng, fann författarna att troper som uttrycket “kärlek är magi” har ökad prevalens under den tyska romantiska perioden, 1700- och 1800-talen. De jämför det med fraser som har minskande valuta, som “kärlekens trummor”.
Poängen är att studien av poesistatistik, möjliggjort av stora datainsamlingar och nya analytiska verktyg, ger stöd för känslan av att det finns mönster, åtminstone formella mönster, som ligger till grund för den kreativa impulsen och att det därför måste finnas något som kan fångas av lämpligt program.
Höjdpunkten för allt detta är att de flesta människor verkar vara oförmögna att berätta skillnaden mellan en maskins skrivning och en persons, och om de kan berätta alls bryr de sig inte nödvändigtvis.
I en uppsats i januari, under rubriken “Artificiell intelligens kontra Maya Angelou: Experimentellt bevis på att människor inte kan skilja AI-genererad från mänsklig skriven poesi”, Nils Köbis och Luca D. Mossink från University of Amsterdam och Max Planck-institutet bad folk välja vilka de föredrog bland två dikter som var och en började med samma rad, en kompletterad av en person och en kompletterad av GPT-2.
I flera olika testuppsättningar fann författarna att “människor inte på ett tillförlitligt sätt kan identifiera mänskligt kontra algoritmiskt kreativt innehåll.”
Dessutom visade många att de hade det bra med de maskintillverkade dikterna även när de fick veta innan de läste en algoritm.
I en annan studie genererade Andrea Zugarini och kollegor vid universitetet i Florens och Siena 2019 tercets, en enhet med tre rader i en dikt, och utmanade människor att berätta för dem från Dante Alighieris egna tercets i sitt poetiska mästerverk The Divine Comedy.
Naiva mänskliga domare, de utan någon speciell bakgrund i Dante-studier, bedömde att de genererade terretterna verkligen var skrivna av Dante nästan hälften av tiden, i grunden ett myntkast. Dante-experter gick bättre.
Zugarini och kollegor drar slutsatsen att deras arbete kan “hålla Divine Comedy's meter och rim” även om det misslyckas i andra avseenden.
När forskare blir bättre och bättre på att konstruera sådana formella utvärderingar, där människor är villiga att acceptera en maskin som är giltig som approximerar ytliga egenskaper, kan bekymmerna för mänsklig konst blekna.
Därför kan en typ av guldålder för mänskligt och AI-samarbete sättas att utvecklas, med kopplingar, tercets och kvatriner som exploderar på scenen snabbare än du kan säga
så mycket beror
på
ett rött hjul
barrow
måste läsa
Etik för AI: Fördelar och risker med artificiell intelligens
Den ökande omfattningen av AI ökar insatserna för stora etiska frågor.
Läs mer
Relaterade ämnen:
Digital Transformation CXO Internet of Things Innovation Enterprise Software Smart Cities