AI schrijft nog steeds waardeloze poëzie

0
179

Tiernan Ray

Door Tiernan Ray | 3 juni 2021 — 14:13 GMT (15:13 BST) | Onderwerp: Kunstmatige Intelligentie

Haar ogen, dubbele poelen van mystiek licht,
Voor altijd in haar stralende wit—, 
Ze zocht de boezem van de Nacht.
Daar kwam het, die mystieke aanblik!

— Anonieme menselijke schrijver in samenwerking met poëzie-algoritme

Een overzicht van recente literatuur in de categorie machine learning van kunstmatige intelligentie laat een gestage vooruitgang zien in de ontwikkeling van technieken voor het automatisch genereren van poëzie.

De output blijft redelijk matig, maar het wordt goed genoeg dat sommige menselijke lezers de gedichten respectabele cijfers zullen geven in gecontroleerde evaluaties. En sommige mensen zullen zelfs voor de gek worden gehouden door menselijk auteurschap toe te schrijven aan machinale poëzie.

Hoewel de essentie van de meest sublieme vorm van menselijk schrijven aan AI ontsnapt, is de software bekwaam genoeg om faxen te genereren die een test kunnen doorstaan.

Het gedicht dat bovenaan dit artikel staat, is gedeeltelijk door een machine gemaakt. Een Google-softwareprogramma, Vers voor Vers genaamd, dat in maart werd geïntroduceerd, neemt een stukje input van een mens, de eerste regel tekst, Haar ogen, twee poelen van mystiek licht. Het vervolgt dan de strofe en produceert automatisch de volgende drie regels.

Dit kwatrijn, zoals het wordt genoemd, werd gunstig beoordeeld door massawerkers die Google inschakelde om de mens-plus-machine-creaties te vergelijken met gedichten die volledig door een mens zijn geschreven. Het programma en de evaluaties worden beschreven in de inleidende paper van Google-onderzoekers David Uthus, Maria Voitovich en R.J. Misch.

Het vermogen van Vers voor Vers om tekst te produceren is het resultaat van het feit dat het programma een corpus van tweeëntwintig verschillende dichters heeft opgenomen. Op de website van het programma wordt een gebruiker uitgenodigd om maximaal drie van de beroemde dichters als “muzen” te kiezen om een ​​gedicht te voltooien waarvoor de gebruiker de eerste regel levert.

Het resultaat is een grappig gezelschapsspel en een waardeloos gedicht. Dit is wat er gebeurt als vers voor vers de eerste regel van Rainer Maria Rilke's Duino Elegies wordt gevoerd:

von-rilke-my-poem.png

De uitvoer met vier regels vereist dat de gebruiker een keuze maakt uit meerdere voorgestelde regels die door het algoritme zijn gegenereerd, waarbij elke regel is geconditioneerd om in de trant van een van de drie gekozen dichters te zijn. Hoewel sommige andere combinaties wenselijker zouden kunnen zijn – keuze en mogelijkheid zijn kenmerkende elementen van automatische tekst – is het onwaarschijnlijk dat er een baanbrekend vers zou ontstaan, zelfs niet met veel pogingen.

verse-by -verse-poetry-architecture-june-2021.jpg

De poëziemachine: Google's Vers voor Vers neemt een lichaam van werken als invoer om een ​​neuraal netwerk van Transformer te trainen om tekst in het algemeen te genereren, en vervolgens kan de uiteindelijke uitvoer van een gebruikerssessie worden bepaald op basis van invoervoorbeelden van specifieke dichters.

Uthus et al.

Vers voor Vers is een voorbeeld van een trend in het afgelopen decennium onder AI-wetenschappers in de academische wereld en onderzoekers bij Google en andere grote bedrijven, om machine learning-programma's te verfijnen die ofwel een volledig nieuw werk genereren of een zinsinvoer door een persoon uitbreiden.

De werken maken allemaal gebruik van zogenaamde taalmodellen, programma's die machinaal leren gebruiken om een ​​statistische weergave te maken van hoe woorden typisch samenvallen in een zin. Het paradigmatische taalmodel is GPT-3, een programma dat vorig jaar werd uitgebracht door de startup OpenAI in San Francisco en dat de wereld stormenderhand heeft veroverd.

Veel commentatoren zijn absoluut getroffen door de schijnbaar menselijke tekst van GPT-3. Stephan Marche van de New Yorker heeft geschreven dat GPT-3 kan schrijven als Franz Kafka, daarbij verwijzend naar een fragment van The Metamorphosis dat opnieuw is geschreven door GPT-3.

Ook: Wat is GPT-3? Alles wat uw bedrijf moet weten over het baanbrekende AI-taalprogramma van OpenAI

In feite klinkt de redux echt niet als het origineel. Maar Marche en anderen hebben de belangrijkste prestatie van GPT-3 en andere taalmodellen ontdekt, namelijk het repliceren van de oppervlaktekwaliteiten van woordcombinaties, waaronder stilistische emulatie.

Poëzie is een populaire keuze geweest om de grenzen te verleggen van wat dergelijke taalmodellen kunnen vastleggen, omdat de meeste poëzie wordt gekenmerkt door formele kwaliteiten die statistisch kunnen worden gemeten, waaronder metrum, rijmschema en assonantie.

Recent werk over AI-poëzie probeert die formele elementen met toenemende nauwkeurigheid na te bootsen.

Kevin Yang en Dan Klein van U.C. Berkeley publiceerde in april een artikel over hun uitvinding, FUDGE genaamd, die automatisch de tweede regel van Shakespeare's coupletten kan genereren, waarbij spontaan jambische pentameter wordt gerepliceerd, het klemtoonpatroon dat Shakespeare zo effectief gebruikte.

Wat naar voren komt zijn onhandige coupletten maar fatsoenlijk formalisme. Hier is Shakespeare's originele sonnet Nummer 48:

Hoe voorzichtig was ik toen ik mijn weg bewandelde,
Elk kleinigheidje onder de meest zuivere tralies om te duwen,
Dat het voor mijn gebruik ongebruikt zou kunnen blijven
Uit handen van leugens, in zekere wijken van vertrouwen!
Maar jij, voor wie mijn juwelen kleinigheden zijn,
Meest waardige troost, nu mijn grootste verdriet,
Jij het liefste, en mijn enige zorg,
Art verliet de prooi van elke vulgaire dief.
U heb ik niet opgesloten in een kist,
Behalve waar u niet bent, hoewel ik voel dat u het bent,
Binnen de zachte sluiting van mijn borst,
Vanwaar u naar believen kunt komen en deel;
       En zelfs daar zul je worden gestolen, vrees ik,
      Want de waarheid blijkt dief te zijn voor een zo dierbare prijs.

In FUDGE nemen Yang en Klein de eerste regel van het laatste couplet, en zelfs daar zul je worden gestolen, vrees ik, en laat het programma een nieuwe tweede regel schrijven. Wat eruit komt is niet zo poëtisch en draagt ​​geen spoor van de uitgebreide metaforen van het sonnet:

En zelfs daar zul je worden gestolen, vrees ik,
want dit zal worden het einde. Dat is vrij duidelijk.

Technologisch is FUDGE een hoogstandje. Yang en Klein hebben de voorganger van GPT-3 uit 2019, GPT-2, overgenomen en aangepast. (GPT-2 kan worden gedownload, waardoor het een populaire keuze is voor de ontwikkeling van taalmodellen, in tegenstelling tot GPT-3, waarvan het gebruik wordt beperkt door OpenAI.) 

GPT-2 en GPT-3 niet iets weten over jambische pentameter, ze apen alleen maar welke voorbeeldstijl ze ook krijgen. Door enkele regels code toe te voegen, konden Yang en Klein FUDGE dwingen zich op betrouwbare wijze aan jambisch te houden. Daarom vervullen FUDGE coupletten een stilistische verplichting op een consistente manier.

Yang en Klein, tot hun verdienste, maken zich geen illusies over de kwaliteit van het gegenereerde couplet. “Shakespeare is alleen opgenomen als een grillig referentiepunt”, schrijven ze, “onze generaties staan ​​duidelijk niet in voor de originelen van Shakespeare.”

Als machinegedichten plat vallen, is dat des te duidelijker binnen een heel bijzondere formele traditie. Neem limericks, die geliefde gedichten van vijf regels met een consistente opstelling van lettergrepen en een consistent rijmschema.

Michael Palin, bekend van Monty Python, heeft zelf gemaakte limericks aangeboden:

Ze zeiden over een verloskundige die Paula heette:
Als er problemen waren, bel haar dan gewoon.
Haar vaardigheden in het water
Ze leerde van een portier
Die vis vers van een trawler afleverde.

Of zulke gedichten nu grappig zijn of niet, en dat wordt over het algemeen ook verondersteld, ze hebben meestal één compleet idee dat wordt uitgespeeld in de vijf regels, met een soort twist of verrassende draai die is ontworpen om genot te produceren.

Om te proberen limericks automatisch te genereren, introduceerden Jianyou Wang en collega's van Duke University in maart LimGen. LimGen gebruikt een zogenaamd sjabloon, een set regels over hoe limerick-lijnen worden gevormd, zoals een onderwerp plus een werkwoord plus een object. Dat is gebaseerd op 300 limericks als voorbeeld, een relatief kleine selectie.

Wang en team voegen aan de sjabloon een ander algoritme toe, populair in taalmodellen, een straalzoekopdracht. Het beoordeelt automatisch de tekst die door het sjabloonprogramma wordt gegenereerd om de beste output te selecteren, als een soort stembevoegdheid.

De resultaten werken in zekere zin, door het gevoel te doen denken aan limericks, maar ze hebben iets plats:

Er was een eerlijke man genaamd Dwight 
Die alles verloor zijn geld in een gevecht.
Zijn vrienden waren zo overstuur,
Ze wilden wedden, 
En ze hielden niet van wrok.

Er was een luidruchtige serveerster genaamd Jacque, 
die al haar koffie in een shake schonk.
Maar op het moment dat ze bewoog,
Ze werd geraakt door een vogel,
Toen zag ze hem naar het meer vliegen.

Hoewel er grofweg continuïteit is in deze limericks, is er een vreemde ontbinding tegen het einde van elke strofe, alsof de ontwikkeling van het idee is overgegeven aan de formele beperkingen.

wang-et-al -limgen-architecture-2021.jpg

De limerick-machine: een sjabloon stelt zinnen samen die automatisch overeenkomen met bekende beperkingen voor wat elke regel van een limerick zou moeten zijn, en dan kiest een automatische zoekfunctie, genaamd beam search, de beste kandidaatlijnen.

Wang et al.

Gezien de onbevredigende resultaten van onbewerkte uitvoer, zullen meer programma's waarschijnlijk de menselijke samenwerking van Google in Vers voor Vers navolgen.

De gebruikelijke term in AI voor die gecombineerde inspanning is human-in-the-loop. Een opvallende omkering die naar voren is gekomen, is 'computer-in-the-loop'.

Imke van Heerden en Anil Bas, wetenschappers van de Koç ̧University en Marmara University in Istanbul, debuteerden in maart met een computer-in-the-loop-aanpak om mensen in te schakelen om een ​​door een machine gegenereerde tekst effectief te bewerken tot een gedicht. Ze richten zich op Afrikaans, een van de officiële talen in Zuid-Afrika en andere landen in de regio, een taal die traditioneel niet veel aandacht heeft gekregen in AI-taalmodellen.

Het taalmodelprogramma van Van Heerden en Bas, AfriKI genaamd, voor 'Afrikaanse Kunsmatige Intelligensie', Afrikaanse kunstmatige intelligentie, probeert expliciet menselijk werk te verbeteren in plaats van te verdringen.

“Terwijl [het genereren van natuurlijke taal] in zijn zoektocht naar volledige automatisering de menselijke betrokkenheid misschien afkeurt, doet ons mensgerichte raamwerk het tegenovergestelde”, schrijven ze.

“Dit onderzoek toont aan dat samenwerking tussen mens en machine de menselijke creativiteit kan vergroten.”

AfriKI neemt alle 208.616 woorden op van een enkele Afrikaanstalige roman, Die Biblioteek aan die Einde van die Wêreld (De bibliotheek aan het einde van de wereld) van Etienne van Heerden.

In een proces dat lijkt op Google's Vers voor Vers, genereert AfriKI honderden prozazinnen, en de mens kiest welke zinnen hij wil gebruiken en de volgorde waarin ze tot een strofe moeten worden samengevoegd.

Het resultaat zijn korte stukjes met levendige beelden en een aantal interessante metaforen: 

Die konstabel se skiereiland

Afrika drink
onheil in die water.
Die landskap kantel sy rug
in sigbewaking en vlam.
Ons oopgesnyde sake
brandtrappe vir die ander state.
Hierdie grond woord intimidasie.

Het schiereiland van de agent

Afrika drinkt
rampspoed in het water.
Het landschap leunt achterover
in bewaking en vlammen.
Onze openstaande zaken
brandtrappen voor andere staten.
Deze bodem wordt intimidatie.

Zoals de auteurs opmerken, is er hier genoeg beeldtaal en metaforen om aan sommige poëziescholen te doen denken. “De taal kan worden omschreven als minimalistisch, suggestief en abstract, en daarom open voor interpretatie, die lijkt op imagist en surrealistische poëzie.”

Tot op zekere hoogte. De gedichten lijken nog steeds grotendeels getint met kleuren, penseelstreken, zonder een idee te hebben.

Het is gemakkelijk om de gemeenschappelijke valkuil te zien waaraan alle taalmodellen bezwijken. Machine learning-programma's zijn transformatiemachines: hun nut is om sommige invoergegevens op een geautomatiseerde manier om te zetten in uitvoer.

Taalmodellen gebruiken voorbeeldtekst, zoals gedichten, en transformeren deze in een partituur die de verwantschap van woorden samenvat in de frequentie van hun gelijktijdige voorkomen, evenals vele andere meetbare dingen zoals de frequentie van geluiden en het aantal lettergrepen.

Ook: AI in zestig seconden

Op die manier voert AI een compressieactie, waarbij hele bibliotheken worden gecomprimeerd tot voordelige bundels met statistieken. De handeling van decompressie reconstrueert de formele taalpatronen in de gegenereerde tekst.

Wat aan zo'n proces ontsnapt, is een ander soort compressie, de compressie van associaties door de menselijke dichter op een veel grotere schaal. Poëzie speelt langs de randen van de dingen en wat ongezegd blijft, kan daardoor naar boven komen.

Hier zijn Romeo en Julia die elkaar romantiseren met woordspelingen:

ROMEO: Als ik ontheilig met mijn onwaardige hand
Dit heilige heiligdom, de zachte zonde is dit
Mijn lippen, twee blozende pelgrims, klaar om te staan
Om die ruwe aanraking glad te strijken met een zachte kus

JULIET: Goede pelgrim, je doet je hand te veel onrecht,
Welke welgemanierde toewijding hierin laat zien;
Want heiligen hebben handen die pelgrimshanden aanraken,
En handpalm tot handpalm is heilige palmerskus.

De lijnen bevatten niet alleen de formele relatie tussen geluid en beeld in de interne structuur. Ze bevatten ook het spel van het omdraaien van ideeën, ze vanuit verschillende hoeken bekijken, ze breken als licht.

Of dat kan worden vastgelegd in een statistisch model, misschien een meer geavanceerd model, is een interessante vraag. Maar op dit moment mist de stand van de techniek in AI het punt.

De weggever is de manier waarop AI-onderzoekers over hun inspanningen spreken. De verschillende taalalgoritmen werken allemaal aan 'het probleem van het genereren van gedichten', zoals een artikel het uitdrukt. Maar generatie is waarschijnlijk de verkeerde term.

In zijn Brieven aan een jonge dichter schreef Rilke over het belang van eenzaamheid als iets dat de zaken van de wereld wegneemt en duidelijk maakt wat essentieel is.

Kijk nog eens naar de eerste regel van Rilke's Duino Elegies:

Wer, wenn ich schriee, hörte mich denn aus der Engel Ordnungen?

Wie, als ik huilde, zou mij horen onder de hiërarchie van engelen?

De romanschrijver William Gass heeft gezegd dat Rilke de Elegieën niet zozeer heeft voortgebracht, maar ze heeft ontvangen.

“De Duino Elegies zijn niet geschreven”, merkt William Gass op, “er werd op gewacht”, zoals de criticus Lewis Hyde hem citeert. (Gass zelf zei dat zijn preoccupatie met formele schrijfkwaliteiten een infantiele fase was, een obstakel. “Pas toen ik klaar was om uit mijn formele fase te komen, begon ik Rilke te lezen,” heeft hij gezegd.) < /p>

De menselijke dichter is, in plaats van een transformatiemachine, meer een fijn afgestelde antenne die oppikt wat er al is. De eenzaamheid waar Rilke naar verwees, maakt dat soort aandacht mogelijk.

AI, als een transformatiemachine, draait in de tegenovergestelde richting van eenzaamheid, stilte, stilte. AI is in zekere zin bang voor een vacuüm. Het doel is om totale informatie, Big Data, te reconstrueren. Vaker wel dan niet, kan automatische taal het niet helpen om meer dingen toe te voegen.

Sommige AI-onderzoeken erkennen openlijk de nadelen van het louter repliceren van formele kwaliteiten. Een onderzoek door IBM-onderzoekers in 2018, genaamd Deep-Speare, vroeg menselijke menigtewerkers om te beoordelen of een Shakespeare-sonnet daadwerkelijk door The Bard was of door een machine was gegenereerd.

Hoewel veel gedichten door de machine als succesvol werden beoordeeld op formele gronden – rijm en metrum, bijvoorbeeld – vonden menselijke menigtewerkers gedichten onbevredigend in termen van emotionele impact. Dat deed ook een professor Engels, Adam Hammond van de Universiteit van Toronto.

Zoals de auteurs schrijven,

Ondanks de uitstekende vorm, kan de uitvoer van ons model gemakkelijk worden onderscheiden van door mensen geschreven poëzie vanwege de lagere emotionele impact en leesbaarheid. Hier zijn met name aanwijzingen dat onze focus op vorm de leesbaarheid van de resulterende gedichten schaadt.

Desalniettemin zal de voorliefde van AI voor een overdaad aan informatie alleen maar toenemen naarmate meer wetenschappers menselijke poëzie onderwerpen aan analytische technieken die massale onderzoeken van teksten gebruiken, die vervolgens kunnen worden gesneden en in blokjes gesneden.

Bijvoorbeeld, Thomas Nikolaus Haider van de Universiteit van Stuttgart, en Steffen Eger van de Technische Universiteit, Darmstadt, hebben in 2019 een corpus samengesteld van 75.000 gedichten in het Duits van 269 auteurs, van de 16e eeuw tot heden . Het is 'het grootste poëziecorpus tot nu toe', merken ze op.

De auteurs analyseerden de “tropen” in de gedichten, wat betekent dat patronen van het uitdrukken van een bepaald concept in taal die terugkeren – nogmaals, dingen die kunnen worden gekwantificeerd.

Met behulp van een bekende machine learning-techniek, waarbij nevenschikkingen van woorden een numerieke score krijgen, ontdekten de auteurs dat stijlfiguren zoals de uitdrukking “liefde is magie” steeds vaker voorkomen in de Duitse romantische periode, de 18e en 19e eeuw. Ze vergelijken dat met frases die steeds minder populair zijn, zoals 'the drums of love'.

Het punt is dat de studie van de statistiek van poëzie, mogelijk gemaakt door grote verzamelingen gegevens en nieuwe analytische hulpmiddelen, steun verleent aan het gevoel dat er patronen zijn, althans formele patronen, die ten grondslag liggen aan de creatieve impuls , en dat er daarom iets moet zijn dat door het juiste programma kan worden vastgelegd.

De clou van dit alles is dat de meeste mensen niet in staat lijken te zijn om het verschil te zien tussen het schrijven van een machine en dat van een persoon, en als ze het al kunnen zien, maakt het ze niet per se uit.

In een artikel in januari, met de grappige titel “Artificial Intelligence versus Maya Angelou: Experimental evidence that people can can different AI-gegenereerde van door mensen geschreven poëzie”, Nils Köbis en Luca D. Mossink van de Universiteit van Amsterdam en het Max Planck-instituut vroeg mensen om uit twee gedichten te kiezen die elk met dezelfde regel begonnen, één voltooid door een persoon en één voltooid door GPT-2.

In meerdere verschillende testopstellingen ontdekten de auteurs dat 'mensen niet op betrouwbare wijze in staat zijn om menselijke versus algoritmische creatieve inhoud te identificeren'.

Bovendien lieten veel mensen zien dat ze de machinaal gemaakte gedichten prima konden vinden, zelfs als ze van tevoren te horen kregen dat ze het werk van een algoritme lazen.

In een ander onderzoek genereerden Andrea Zugarini en collega's van de universiteiten van Florence en Siena in 2019 tercets, een eenheid van drie regels in een gedicht, en daagden ze mensen uit om ze te vertellen van Dante Alighieri's eigen tercets in zijn poëtische meesterwerk The Divine Comedy.

Naïeve menselijke rechters, mensen zonder specifieke achtergrond in Dante-studies, oordeelden dat de gegenereerde tercets bijna de helft van de tijd echt door Dante waren geschreven, in feite een opgooien van munten. Dante-experts deden het beter.

Zugarini en collega's concluderen dat hun werk “de maat en rijm van Divine Comedy kan behouden”, zelfs als het in andere opzichten faalt.

Naarmate onderzoekers steeds beter worden in het construeren van dergelijke formele evaluaties, waarbij mensen bereid zijn een machine als geldig te accepteren die oppervlakkige kwaliteiten benadert, dan kunnen de zorgen van menselijke kunst vervagen.

Daarom kan een soort gouden eeuw van samenwerking tussen mens en AI zich ontvouwen, met coupletten, terceten en kwatrijnen die sneller op het toneel exploderen dan je kunt zeggen. 

er hangt zoveel af

van

een rood wiel

kruiwagen

moet lezen

Ethiek van AI: voordelen en risico's van kunstmatige intelligentie

Ethiek van AI: voordelen en risico's van kunstmatige intelligentie

De toenemende schaal van AI verhoogt de inzet voor belangrijke ethische vragen.

Lees meer

Verwante onderwerpen:

Digitale transformatie CXO Internet of Things Innovatie Enterprise Software Smart Cities Tiernan Ray

Door Tiernan Ray | 3 juni 2021 — 14:13 GMT (15:13 BST) | Onderwerp: Kunstmatige Intelligentie