KI schreibt immer noch miese Poesie

0
198

Tiernan Ray

Von Tiernan Ray | 3. Juni 2021 – 14:13 GMT (15:13 BST) | Thema: Künstliche Intelligenz

Ihre Augen, Zwillingspfützen aus mystischem Licht,
Für immer in ihrem strahlenden Weiß –, 
Sie suchte den Busen der Nacht.
Da kam dieser mystische Anblick!

— Anonymer menschlicher Autor in Zusammenarbeit mit Poesiealgorithmus  

Eine Untersuchung der neueren Literatur in der Kategorie des maschinellen Lernens der künstlichen Intelligenz zeigt stetige Fortschritte bei der Entwicklung von Techniken zur automatischen Generierung von Poesie.

Die Ausgabe bleibt ziemlich mittelmäßig, aber sie wird gut genug, dass einige menschliche Leser den Gedichten in kontrollierten Bewertungen respektable Noten geben. Und manche Leute werden sogar dazu verleitet, der maschinellen Poesie menschliche Autorenschaft zuzuschreiben.

Während das Wesentliche der erhabensten Form des menschlichen Schreibens der KI entgeht, ist die Software kompetent genug, um Faksimiles zu erstellen, die einen Test bestehen können.

Das oben in diesem Artikel aufgeführte Gedicht wurde teilweise von einer Maschine erstellt. Ein Google-Softwareprogramm namens Verse by Verse, das im März vorgestellt wurde, nimmt eine Eingabe von einem Menschen, die erste Textzeile, ihre Augen, Zwillingspools aus mystischem Licht. Es setzt dann die Strophe fort und erzeugt automatisch die folgenden drei Zeilen.

Dieser Vierzeiler, wie er genannt wird, wurde von Crowdworkern positiv bewertet, die Google beauftragt hat, die Kreationen von Mensch und Maschine mit Gedichten zu vergleichen, die vollständig von einem Menschen geschrieben wurden. Das Programm und die Auswertungen werden im Einführungspapier der Google-Forscher David Uthus, Maria Voitovich und R.J. Mikrofon.

Die Fähigkeit von Verse by Verse, Text zu produzieren, ist das Ergebnis des Programms, das ein Korpus von 22 verschiedenen Dichtern aufgenommen hat. Auf der Website des Programms wird ein Benutzer aufgefordert, bis zu drei der berühmten Dichter als “Musen” auszuwählen, um ein Gedicht zu vervollständigen, für das der Benutzer die erste Zeile liefert.

Das Ergebnis ist ein amüsantes Gesellschaftsspiel und ein mieses Gedicht. Das passiert, wenn Vers für Vers mit der ersten Zeile von Rainer Maria Rilkes Duino-Elegien gefüttert wird:

von-rilke-my-poem.png

Bei der Ausgabe mit vier Zeilen muss der Benutzer aus mehreren vorgeschlagenen Zeilen auswählen, die vom Algorithmus generiert wurden, wobei jede Zeile so konditioniert ist, dass sie einem der drei ausgewählten Dichter entspricht. Während einige andere Kombinationen wünschenswerter sein könnten – Auswahl und Möglichkeit sind charakteristische Elemente von automatischem Text – ist es unwahrscheinlich, dass selbst bei vielen Versuchen ein bahnbrechender Vers entstehen würde.

verse-by -verse-poetry-architecture-june-2021.jpg

Die Poesiemaschine: Googles Verse by Verse nimmt einen Körper von body arbeiten als Eingabe, um ein neuronales Transformer-Netzwerk zu trainieren, um Text im Allgemeinen zu generieren, und dann kann die endgültige Ausgabe jeder Benutzersitzung auf Eingabeproben bestimmter Dichter konditioniert werden.

Uthus et al.

Verse by Verse ist ein Beispiel für einen Trend des letzten Jahrzehnts unter KI-Wissenschaftlern in der akademischen Welt und Forschern bei Google und anderen großen Unternehmen, maschinelle Lernprogramme zu verfeinern, die entweder ein völlig neues Werk generieren oder eine Phraseneingabe durch eine Person erweitern.

Die Werke verwenden alle so genannte Sprachmodelle, Programme, die maschinelles Lernen verwenden, um eine statistische Darstellung zu erstellen, wie Wörter normalerweise in einem Satz zusammenfallen. Das paradigmatische Sprachmodell ist GPT-3, ein Programm, das letztes Jahr vom San Francisco Startup OpenAI veröffentlicht wurde und die Welt im Sturm erobert hat.

Viele Kommentatoren waren vom scheinbar menschlichen Text von GPT-3 absolut gefesselt. Stephan Marche vom New Yorker hat geschrieben, dass GPT-3 wie Franz Kafka schreiben kann, und zitiert einen Ausschnitt aus The Metamorphosis, der von GPT-3 neu geschrieben wurde.

Auch: Was ist GPT-3? Alles, was Ihr Unternehmen über das bahnbrechende KI-Sprachprogramm von OpenAI wissen muss

Tatsächlich klingt das Redux wirklich nicht wie das Original. Aber Marche und andere haben die Hauptleistung von GPT-3 und anderen Sprachmodellen erkannt, nämlich die Oberflächenqualitäten von Wortkombinationen zu replizieren, die stilistische Emulationen beinhalten können.

Poesie ist eine beliebte Wahl, um die Grenzen dessen, was solche Sprachmodelle erfassen können, zu verschieben, da die meisten Gedichte durch formale Qualitäten gekennzeichnet sind, die statistisch gemessen werden können, einschließlich Metrum, Reimschema und Assonanz.

Neuere Arbeiten zur KI-Poesie versuchen, diese formalen Elemente mit zunehmender Strenge nachzuahmen.

Kevin Yang und Dan Klein von U.C. Berkeley veröffentlichte im April einen Artikel über ihre Erfindung namens FUDGE, der automatisch die zweite Zeile von Shakespeares Couplets erzeugen kann, indem er spontan den jambischen Pentameter repliziert, das Betonungsmuster, das Shakespeare so effektiv nutzte.

Was herauskommt, sind klobige Couplets, aber anständiger Formalismus. Hier ist Shakespeares originales Sonett Nummer 48:

Wie vorsichtig war ich, als ich mich auf den Weg machte,
Jede Kleinigkeit unter wahrsten Stäben zu stoßen,
Dass es für meinen Gebrauch ungenutzt bleiben könnte
Aus den Händen der Lüge, in sicheren Schutzzaubern!
Aber du, dem meine Kleinigkeiten meine Juwelen sind,
Wertvoller Trost, jetzt mein größter Kummer,
Du liebster Liebling und mein einziger Sorge,
Du bist die Beute jedes gemeinen Diebes.
Dich habe ich in keiner Truhe eingeschlossen,
außer wo du nicht bist, obwohl ich fühle, dass du bist,
In der sanften Schließung meiner Brust,
woher du nach Belieben kommen kannst und Teil;
       Und selbst da wirst du gestohlen werden, fürchte ich,
      Denn die Wahrheit erweist sich als Dieb um einen so teuren Preis.

In FUDGE nehmen Yang und Klein die erste Zeile des Schlusspaares, und selbst dann wirst du, fürchte ich, gestohlen und das Programm eine neue zweite Zeile schreiben lassen. Was dabei herauskommt, ist nicht so poetisch und trägt keine Spur von den ausgedehnten Metaphern des Sonetts:

Und selbst dann wirst du gestohlen, fürchte ich,
denn das wird sein das Ende. Das ist ziemlich klar.

Technologisch ist FUDGE eine Meisterleistung. Yang und Klein haben den Vorgänger von GPT-3 aus dem Jahr 2019, GPT-2, genommen und optimiert. (GPT-2 steht zum Download bereit, was es zu einer beliebten Wahl für die Entwicklung von Sprachmodellen macht, im Gegensatz zu GPT-3, dessen Verwendung durch OpenAI eingeschränkt ist.) 

GPT-2 und GPT-3 nicht wissen alles über den jambischen Pentameter, sie ahmen nur den Beispielstil nach, der ihnen gegeben wird. Durch das Hinzufügen einiger Codezeilen konnten Yang und Klein FUDGE zwingen, sich zuverlässig an Jambic zu halten. FUDGE Couplets erfüllen damit konsequent eine stilistische Verpflichtung.

Yang und Klein machen sich keine Illusionen über die Qualität des generierten Couplets. “Shakespeare ist nur als skurriler Bezugspunkt enthalten”, schreiben sie, “unsere Generationen halten offensichtlich Shakespeares Originalen nicht das Wasser”.

Wenn Maschinengedichte scheitern, ist dies innerhalb einer ganz bestimmten formalen Tradition umso offensichtlicher. Nehmen Sie Limericks, diese beliebten fünfzeiligen Gedichte, die eine konsistente Anordnung von Silben und ein konsistentes Reimschema haben.

Michael Palin, berühmt für Monty Python, hat Limericks seiner eigenen Kreation angeboten:

Sie sagten von einer Hebamme namens Paula,
Wenn es Probleme gab, ruf sie einfach an.
Ihre Fähigkeiten im Wasser
Sie lernte von einem Portier
Der Fisch lieferte, frisch, von einem Trawler.

Ob solche Gedichte lustig sind oder nicht, und sie sollen es im Allgemeinen sein, sie haben normalerweise eine vollständige Idee, die in den fünf Zeilen gespielt wird, mit einer Art Wendung oder überraschend Wendung, die Freude bereiten soll.

Um zu versuchen, Limericks automatisch zu generieren, haben Jianyou Wang und Kollegen von der Duke University im März LimGen vorgestellt. LimGen verwendet eine sogenannte Vorlage, eine Reihe von Regeln, wie Limerick-Linien gebildet werden, z. B. ein Subjekt plus ein Verb plus ein Objekt. Das basiert auf 300 Limericks als Beispiel, eine relativ kleine Auswahl.

Wang und sein Team fügen der Vorlage einen weiteren Algorithmus hinzu, der in Sprachmodellen beliebt ist und als Strahlsuche bezeichnet wird. Es bewertet automatisch den vom Vorlagenprogramm generierten Text, um die beste Ausgabe auszuwählen, als eine Art Abstimmungsinstanz.

Die Ergebnisse funktionieren in gewisser Weise, da sie an Limericks erinnern, aber sie haben etwas Flaches:

Es gab einen ehrlichen Mann namens Dwight 
Der alles verloren hat sein Geld in einem Streit.
Seine Freunde waren so aufgebracht,
Sie waren bereit zu wetten, 
Und sie mochten keine Gehässigkeit.

Da war eine laute Kellnerin namens Jacque, 
die ihren ganzen Kaffee in einem Shake einschenkte.
Aber in dem Moment, als sie sich rührte,
Sie wurde von einem Vogel getroffen,
Dann sah sie ihn zum See fliegen.

Obwohl es in diesen Limericks ungefähr Kontinuität gibt, gibt es gegen Ende jeder Strophe eine seltsame Auflösung, als ob die Entwicklung der Idee den formalen Zwängen ausgeliefert wäre.

wang-et-al -limgen-architecture-2021.jpg

Die Limerick-Maschine: Eine Vorlage stellt Sätze zusammen, die automatisch bekannte Einschränkungen für jede Zeile von ein Limerick sein sollte, und dann wählt eine automatische Suchfunktion, genannt Beam Search, die besten Kandidatenlinien aus.

Wanget al.

Angesichts der unbefriedigenden Ergebnisse der Rohausgabe werden wahrscheinlich weitere Programme die menschliche Zusammenarbeit von Google in Verse by Verse nachahmen.

Der übliche Begriff in der KI für diese kombinierte Anstrengung ist Human-in-the-Loop. Eine auffällige Umkehrung, die sich herausgestellt hat, ist “Computer-in-the-Loop”.

Imke van Heerden und Anil Bas, Wissenschaftler der Koç ̧Universität und der Marmara Universität in Istanbul, stellten im März einen Computer-in-the-Loop-Ansatz vor, um Menschen dazu zu bewegen, einen maschinell generierten Text effektiv zu einem Gedicht zu bearbeiten. Sie konzentrieren sich auf Afrikaans, eine der Amtssprachen in Südafrika und anderen Ländern der Region, eine Sprache, die in KI-Sprachmodellen traditionell nicht viel Aufmerksamkeit erhalten hat.

Das Sprachmodellprogramm von Van Heerden und Bas, genannt AfriKI, für “Afrikaanse Kunsmatige Intelligensie”, Afrikaans künstliche Intelligenz, versucht ausdrücklich, menschliche Arbeit zu verbessern, anstatt sie zu verdrängen.

„Während [die Erzeugung natürlicher Sprache] bei ihrem Streben nach vollständiger Automatisierung die Beteiligung des Menschen missbilligt, tut unser menschzentriertes Framework das Gegenteil“, schreiben sie.

“Diese Studie zeigt, dass die Zusammenarbeit zwischen Mensch und Maschine die menschliche Kreativität steigern kann.”

AfriKI enthält alle 208.616 Wörter eines einzigen afrikaanssprachigen Romans, Die Biblioteek aan die Einde van die Wêreld (Die Bibliothek am Ende der Welt) von Etienne van Heerden.

In einem Prozess, der Googles Verse by Verse ähnlich zu sein scheint, generiert AfriKI Hunderte von Prosa-Phrasen, und der Mensch wählt aus, welche Phrasen und in welcher Reihenfolge sie zu einer Strophe zusammengesetzt werden sollen.

Das Ergebnis sind kurze Stücke mit lebendigen Bildern und interessanten Metaphern: 

Die konstabel se skiereiland

Afrika drink
onheil in the water.
Die landskap kantel sy rug
in sigbewaking en vlam.
Ons oopgesnyde sake
brandtrappe vir die anderen Staat.
Hierdie grond Wort einschüchtern.

Die Halbinsel des Constable

Afrika trinkt
die Katastrophe ins Wasser.
Die Landschaft neigt sich in Überwachung und Flammen den Rücken
.
Unsere aufgeschnittenen Angelegenheiten
Feuerleitern für andere Staaten.
Dieser Boden wird zur Einschüchterung.

Wie die Autoren anmerken, gibt es hier genug figurative Sprache und Metaphern, um an einige Schulen der Poesie zu erinnern. “Die Sprache kann als minimalistisch, evokativ und abstrakt beschrieben werden und ist daher offen für Interpretationen, die der imagistischen und surrealistischen Poesie ähnelt.”

Bis zu einem gewissen Punkt. Die Gedichte scheinen immer noch meist mit Farben, Pinselstrichen gefärbt zu sein, ohne eine Idee zu haben.

Es ist leicht zu erkennen, welcher gemeinsamen Fallstricke alle Sprachmodelle unterliegen. Machine-Learning-Programme sind Transformationsmaschinen: Ihr Nutzen besteht darin, einige Eingabedaten automatisiert in Ausgaben umzuwandeln.

Sprachmodelle nehmen Beispieltexte wie Gedichte und wandeln sie in einen Score um, der die Verwandtschaft von Wörtern in der Häufigkeit ihres gemeinsamen Vorkommens sowie viele andere messbare Dinge wie die Häufigkeit von Lauten und die Silbenanzahl zusammenfasst.

Außerdem: KI in sechzig Sekunden

Auf diese Weise führt die KI Daten aus Komprimierungsaktion, die ganze Bibliotheken in kostengünstige Statistikpakete komprimiert. Der Akt der Dekompression stellt die formalen Sprachmuster im generierten Text wieder her.

Was sich einem solchen Prozess entzieht, ist eine andere Art der Verdichtung, die Verdichtung der Assoziationen des menschlichen Dichters in weit größerem Maßstab. Poesie spielt an den Rändern der Dinge und was unausgesprochen bleibt, ist das, was dabei entstehen kann.

Hier sind Romeo und Julia, die sich mit Wortspielen romantisieren:

ROMEO: Wenn ich mit meiner unwürdigsten Hand entweihe
Dieser heilige Schrein, die sanfte Sünde ist dies
Meine Lippen, zwei errötende Pilger, bereit stehen
Um diese raue Berührung mit einem sanften Kuss zu glätten

JULIET: Guter Pilger, du machst deiner Hand zu viel Unrecht,
Welche manierliche Hingabe zeigt sich darin;
Denn Heilige haben Hände, die die Hände der Pilger berühren,
Und Handfläche an Handfläche ist der Kuss der Heiligen Handballer.

Die Zeilen enthalten nicht nur das formale Verhältnis von Ton und Bild in der inneren Struktur. Sie beinhalten auch das Spiel, Ideen umzudrehen, sie aus verschiedenen Blickwinkeln zu betrachten, sie wie Licht zu brechen.

Ob dies in einem statistischen Modell, vielleicht einem komplexeren, erfasst werden kann, ist eine interessante Frage. Aber im Moment verfehlt der Stand der Technik in der KI das Wesentliche.

Das Giveaway ist die Art und Weise, wie KI-Forscher über ihre Bemühungen sprechen. Die verschiedenen Sprachalgorithmen arbeiten alle am “Problem der Gedichterzeugung”, wie es in einem Artikel heißt. Aber Generation ist wohl der falsche Begriff.

In seinen Briefen an einen jungen Dichter schrieb Rilke über die Bedeutung der Einsamkeit als etwas, das das Geschäft der Welt abstreift und das Wesentliche deutlich macht.

Betrachten Sie noch einmal die erste Zeile von Rilkes Duino Eleg:

Wer, wenn ich schriee, Ordnungen mich denn aus der Engel?

Wer, wenn ich weinte, würde mich in der Hierarchie der Engel hören?

Der Schriftsteller William Gass hat gesagt, dass Rilke die Elegien nicht so sehr erzeugt, sondern sie erhalten hat.

“Die Duino-Elegien wurden nicht geschrieben”, bemerkt William Gass, “sie wurden erwartet”, zitiert ihn der Kritiker Lewis Hyde. (Gass selbst sagte, seine Beschäftigung mit formalen Qualitäten des Schreibens sei eine infantile Phase, ein Hindernis. “Erst als ich bereit war, aus meiner formalen Phase herauszukommen, begann ich, Rilke zu lesen”, sagte er.) < /p>

Der menschliche Dichter ist keine Transformationsmaschine, sondern eher eine fein abgestimmte Antenne, die auffängt, was bereits da draußen ist. Die Einsamkeit, von der Rilke sprach, erlaubt diese Art von Aufmerksamkeit.

KI als Transformationsmaschine läuft in die entgegengesetzte Richtung von Einsamkeit, Stille, Stille. KI fürchtet gewissermaßen ein Vakuum. Ihr Ziel ist es, Gesamtinformationen, Big Data, zu rekonstruieren. In den meisten Fällen kann die automatische Sprache nicht helfen, mehr Dinge hinzuzufügen.

Einige KI-Studien erkennen offen die Nachteile der bloßen Nachbildung formaler Qualitäten an. Eine Studie von IBM-Forschern aus dem Jahr 2018 namens Deep-Speare bat menschliche Crowdworker zu beurteilen, ob ein Shakespeare-Sonett tatsächlich von The Bard stammt oder maschinell generiert wurde.

Während viele Gedichte von der Maschine aus formalen Gründen als erfolgreich beurteilt wurden – Reim und Metrum, sagen wir – fanden menschliche Crowdworker Gedichte in Bezug auf die emotionale Wirkung unbefriedigend. So auch ein Professor für Englisch, Adam Hammond von der University of Toronto.

Wie die Autoren schreiben,

Trotz hervorragender Form kann die Ausgabe unseres Modells aufgrund ihrer geringeren emotionalen Wirkung und Lesbarkeit leicht von von Menschen geschriebener Poesie unterschieden werden. Insbesondere gibt es hier Hinweise darauf, dass unsere Konzentration auf die Form die Lesbarkeit der resultierenden Gedichte tatsächlich beeinträchtigt.

Nichtsdestotrotz wird die Vorliebe der KI für Informationsüberflutung nur zunehmen, da immer mehr Wissenschaftler die menschliche Poesie analytischen Techniken unterziehen, die massive Textüberprüfungen verwenden, die dann in Scheiben geschnitten und gewürfelt werden können.

Zum Beispiel haben Thomas Nikolaus Haider von der Universität Stuttgart und Steffen Eger von der TU Darmstadt im Jahr 2019 ein Korpus von 75.000 deutschen Gedichten von 269 Autoren vom 16. Jahrhundert bis in die Gegenwart zusammengestellt . Es ist “das bisher größte Korpus von Gedichten”, stellen sie fest.

Die Autoren analysierten die “Tropen” in den Gedichten, dh Muster, wie man ein bestimmtes Konzept in der Sprache ausdrückt, die sich wiederholen – wieder Dinge, die quantifiziert werden können.

Unter Verwendung einer bekannten maschinellen Lerntechnik, bei der Aneinanderreihen von Wörtern eine numerische Bewertung erhalten, fanden die Autoren heraus, dass Tropen wie der Ausdruck “Liebe ist Magie” in der deutschen Romantik, dem 18. und 19. Jahrhundert, zunehmend vorherrschen. Sie vergleichen das mit Phrasen, die immer weniger Bedeutung haben, wie zum Beispiel „die Trommeln der Liebe“.

Der Punkt ist, dass das Studium der Statistik der Poesie, das durch große Datensammlungen und neue Analysewerkzeuge ermöglicht wird, das Gefühl unterstützt, dass es Muster gibt, zumindest formale Muster, die dem kreativen Impuls zugrunde liegen , und dass es daher etwas geben muss, das von dem entsprechenden Programm erfasst werden kann.

Die Pointe an all dem ist, dass die meisten Menschen anscheinend nicht in der Lage sind, zwischen der Schrift einer Maschine und der einer Person zu unterscheiden, und wenn sie überhaupt etwas erkennen können, ist es ihnen auch egal.

In einem Artikel vom Januar mit dem amüsanten Titel “Künstliche Intelligenz versus Maya Angelou: Experimentelle Beweise dafür, dass Menschen KI-generierte und von Menschen geschriebene Poesie nicht unterscheiden können”, schreiben Nils Köbis und Luca D. Mossink von der Universität Amsterdam und das Max-Planck-Institut bat die Leute, das von ihnen bevorzugte aus zwei Gedichten auszuwählen, die jeweils mit derselben Zeile begannen, eines von einer Person vervollständigt und eines von GPT-2 vervollständigt.

Bei mehreren unterschiedlichen Testanordnungen stellten die Autoren fest, dass  “Menschen nicht zuverlässig in der Lage sind, kreativen Content von Menschen und algorithmischen Inhalten zu unterscheiden.”

Außerdem zeigten viele Leute, dass sie mit den maschinell erstellten Gedichten gut umgehen können, selbst wenn ihnen im Voraus gesagt wurde, dass sie die Arbeit eines Algorithmus lesen.

In einer anderen Studie generierten Andrea Zugarini und Kollegen an den Universitäten von Florenz und Siena 2019 Terzette, eine dreizeilige Einheit innerhalb eines Gedichts, und forderten die Menschen auf, sie in seinem poetischen Meisterwerk Die Göttliche Komödie von Dante Alighieris eigenen Terzetten zu erzählen.

Naive menschliche Richter, diejenigen ohne besonderen Hintergrund in Dante-Studien, beurteilten die generierten Terzette fast die Hälfte der Zeit als wirklich von Dante geschrieben, im Grunde genommen ein Münzwurf. Dante-Experten erging es besser.

Zugarini und Kollegen kommen zu dem Schluss, dass ihre Arbeit in der Lage ist, “Meter und Reim der Göttlichen Komödie zu halten”, auch wenn sie in anderer Hinsicht versagt.

Da Forscher immer besser darin werden, solche formalen Bewertungen zu konstruieren, bei denen Menschen bereit sind, eine Maschine, die sich oberflächlichen Qualitäten annähert, als gültig zu akzeptieren, können die Bedenken der menschlichen Kunst verblassen.

Daher könnte sich eine Art goldenes Zeitalter der Zusammenarbeit zwischen Mensch und KI entwickeln, in dem Couplets, Terzette und Vierzeiler schneller explodieren, als Sie es sagen können 

so viel hängt

von

einem roten Rad

Schubkarre

muss lesen

Ethik der KI: Vorteile und Risiken künstlicher Intelligenz

Ethik der KI: Vorteile und Risiken von künstlicher Intelligenz

Die zunehmende Verbreitung von KI lässt wichtige ethische Fragen auf dem Spiel stehen.

Weiterlesen

Verwandte Themen:

Digitale Transformation CXO Internet der Dinge Innovation Unternehmenssoftware Smart Cities Tiernan Ray

Von Tiernan Ray | 3. Juni 2021 – 14:13 GMT (15:13 BST) | Thema: Künstliche Intelligenz