I suoi occhi, due pozze di luce mistica,
Per sempre nel suo bianco splendore—,
Ha cercato il seno della Notte.
Via è arrivata, quella vista mistica!— Scrittore umano anonimo in collaborazione con l'algoritmo della poesia
Un'indagine sulla letteratura recente nella categoria dell'apprendimento automatico dell'intelligenza artificiale mostra progressi costanti nello sviluppo di tecniche per la generazione automatica di poesie.
L'output rimane abbastanza mediocre, ma sta diventando abbastanza buono che alcuni lettori umani daranno alle poesie voti rispettabili in valutazioni controllate. E alcune persone saranno persino ingannate nell'attribuire la paternità umana alla poesia macchina.
Mentre l'essenziale della forma più sublime di scrittura umana sfugge all'intelligenza artificiale, il software è abbastanza competente da generare facsimili che possono superare un test.
La poesia elencata all'inizio di questo articolo è stata creata in parte da una macchina. Un programma software di Google, chiamato Verse by Verse, introdotto a marzo, prende un input da un essere umano, la prima riga di testo, I suoi occhi, due pozze di luce mistica. Quindi continua la strofa, producendo automaticamente i tre versi successivi.
Questa quartina, come viene chiamata, è stata considerata favorevolmente dai crowd worker che Google ha arruolato per confrontare le creazioni uomo più macchina con poesie scritte interamente da un essere umano. Il programma e le valutazioni sono descritti nel documento introduttivo dei ricercatori di Google David Uthus, Maria Voitovich e R.J. mica.
La capacità di Verse by Verse di produrre testo è il risultato del fatto che il programma ha ingerito un corpus di opere di ventidue poeti diversi. Sul sito Web del programma, un utente è invitato a scegliere fino a tre poeti famosi come “muse” per completare una poesia per la quale l'utente fornisce la prima riga.
Il risultato è un divertente gioco di società e una pessima poesia. Ecco cosa succede quando Verse by Verse viene alimentata con la prima riga delle Duino Elegies di Rainer Maria Rilke:
L'output a quattro righe richiede all'utente di scegliere tra più righe suggerite generate dall'algoritmo, ciascuna riga condizionata per essere nella vena di uno dei tre poeti scelti. Mentre alcune altre combinazioni potrebbero essere più desiderabili – scelta e possibilità sono elementi distintivi del testo automatico – è improbabile che emerga un verso innovativo anche con molti tentativi.
La macchina della poesia: Google's Verse by Verse contiene un corpo di funzionano come input per addestrare una rete neurale Transformer per generare testo in generale, e quindi l'output finale di qualsiasi sessione utente può essere condizionato su campioni di input di poeti specifici.
Uthus et al.
Verse by Verse è un esempio di una tendenza nell'ultimo decennio tra gli studiosi di intelligenza artificiale nel mondo accademico e i ricercatori di Google e di altre grandi aziende, per perfezionare i programmi di apprendimento automatico che generano un lavoro completamente nuovo o estendono una frase inserita da una persona.
Tutti i lavori utilizzano i cosiddetti modelli linguistici, programmi che utilizzano l'apprendimento automatico per costruire una rappresentazione statistica di come le parole tipicamente si uniscono in una frase. Il modello di linguaggio paradigmatico è GPT-3, un programma rilasciato lo scorso anno dalla startup di San Francisco OpenAI che ha preso d'assalto il mondo.
Molti commentatori sono rimasti assolutamente colpiti dal testo apparentemente umano di GPT-3. Stephan Marche del newyorkese ha scritto che GPT-3 può scrivere come Franz Kafka, citando un frammento di The Metamorphosis riscritto da GPT-3.
Anche: Cos'è GPT-3? Tutto ciò che la tua azienda ha bisogno di sapere sull'innovativo programma linguistico AI di OpenAI
In effetti, il redux non suona davvero come l'originale. Ma Marche e altri hanno colto il principale risultato del GPT-3 e di altri modelli linguistici, che è quello di replicare le qualità superficiali delle combinazioni di parole, che possono includere l'emulazione stilistica.
La poesia è stata una scelta popolare per spingere i limiti di ciò che tali modelli linguistici possono catturare perché la maggior parte della poesia è caratterizzata da qualità formali che possono essere misurate statisticamente tra cui metro, schema di rime e assonanza.
Il lavoro recente sulla poesia AI cerca di imitare quegli elementi formali con crescente rigore.
Kevin Yang e Dan Klein di U.C. Berkeley in aprile ha pubblicato un articolo sulla loro invenzione, chiamato FUDGE, che può generare automaticamente la seconda riga dei distici di Shakespeare, replicando spontaneamente il pentametro giambico, il modello di stress che Shakespeare ha utilizzato in modo così efficace.
Quello che emergono sono distici goffi ma formalismo decente. Ecco il sonetto originale numero 48 di Shakespeare:
Quanto sono stato attento quando ho preso la mia strada,
Ogni sciocchezza sotto le sbarre più vere da spingere,
Che a mio uso potesse rimanere inutilizzato
Dalle mani della menzogna, in sicuri reparti di fiducia!
Ma tu, cui sono i miei gioielli sciocchezze,
Degnissimo conforto, ora il mio più grande dolore,
Tu il più caro e mia unica cura,
Sei lasciato preda di ogni volgare ladro.
Non ti ho rinchiuso in nessuna cassa,
Salvo dove non sei, anche se sento che sei,
Nella dolce chiusura del mio petto,
Da dove a piacere puoi venire e parte;
E anche di là sarai rapito, temo,
Poiché la verità si rivela furba per un premio così caro.
In FUDGE, Yang e Klein prendono la prima riga del distico finale, e anche da lì sarai rubato, temo, e fanno scrivere al programma una nuova seconda riga. Ciò che ne viene fuori non è altrettanto poetico e non porta traccia delle estese metafore del sonetto:
E anche da lì verrai rapito, temo,
perché questo sarà la fine. È abbastanza chiaro.
Tecnologicamente, FUDGE è un tour de force. Yang e Klein hanno preso il predecessore di GPT-3 del 2019, GPT-2, e l'hanno modificato. (GPT-2 è disponibile per il download, il che lo rende una scelta popolare per lo sviluppo di modelli linguistici, a differenza di GPT-3, il cui utilizzo è limitato da OpenAI.)
GPT-2 e GPT-3 no sanno qualcosa del pentametro giambico, si limitano a imitare qualunque stile di esempio gli venga dato. Aggiungendo alcune righe di codice, Yang e Klein sono stati in grado di costringere FUDGE a mantenere in modo affidabile il giambico. Quindi, i distici FUDGE soddisfano un obbligo stilistico in modo coerente.
Yang e Klein, a loro merito, non si fanno illusioni sulla qualità del distico generato. “Shakespeare è incluso solo come punto di riferimento stravagante”, scrivono, “le nostre generazioni ovviamente non resistono agli originali di Shakespeare”.
Quando le poesie macchina falliscono, è tanto più ovvio all'interno di una tradizione formale molto particolare. Prendi i limerick, quegli amati poemi di cinque versi che hanno un arrangiamento coerente di sillabe e uno schema coerente di rime.
Michael Palin, famoso per i Monty Python, ha offerto limerick di sua creazione:
Hanno detto di un'ostetrica di nome Paula,
Se ci sono stati problemi chiamala.
Le sue abilità in acqua
Ha imparato da un facchino
Che consegnava il pesce, fresco, da un peschereccio.
Che queste poesie siano divertenti o meno, e generalmente si suppone che lo siano, di solito hanno un'idea completa che si svolge nelle cinque righe, con una sorta di svolta o sorprendente turno che è progettato per produrre gioia.
Per provare a generare automaticamente i limerick, Jianyou Wang e i colleghi della Duke University a marzo hanno lanciato LimGen. LimGen usa quello che viene chiamato un modello, un insieme di regole su come si formano le linee limerick, come un soggetto più un verbo più un oggetto. Si basa su 300 limerick come esempi, una selezione relativamente piccola.
Wang e il team aggiungono al modello un altro algoritmo, popolare nei modelli linguistici, chiamato ricerca del raggio. Assegna automaticamente un punteggio al testo generato dal programma modello per selezionare l'output migliore, come una sorta di autorità di voto.
I risultati in un certo senso funzionano, ricordando i limerick, ma c'è qualcosa di piatto in loro:
C'era un uomo onesto di nome Dwight
che ha perso tutto i suoi soldi in una rissa.
I suoi amici erano così sconvolti,
Erano disposti a scommettere,
E non amavano sentirsi dispettosi.C'era una cameriera rumorosa di nome Jacque,
che versò tutto il suo caffè in un frullato.
Ma nel momento in cui si è mossa,
Fu colpita da un uccello,
Poi lo vide volare verso il lago.
Sebbene ci sia, grosso modo, continuità in questi limerick, c'è una strana dissoluzione verso la fine di ogni strofa, come se lo sviluppo dell'idea fosse stato ceduto ai vincoli formali.
La macchina limerick: un modello assembla automaticamente frasi che corrispondono a vincoli noti per ciò che ogni riga di dovrebbe essere un limerick, quindi una funzione di ricerca automatica, chiamata ricerca del raggio, seleziona le migliori linee candidate.
Wang et al.
Dati i risultati insoddisfacenti dell'output non elaborato, più programmi probabilmente emuleranno la collaborazione umana di Google in Verse by Verse.
Il termine usuale in intelligenza artificiale per questo sforzo combinato è human-in-the-loop. Un'inversione sorprendente che è emersa è “computer-in-the-loop”.
Imke van Heerden e Anil Bas, studiosi dell'Università Koç ̧ e dell'Università di Marmara di Istanbul, a marzo hanno presentato un approccio computer-in-the-loop per arruolare gli umani per modificare efficacemente un testo generato dalla macchina in una poesia. Si concentrano sull'afrikaans, una delle lingue ufficiali in Sudafrica e in altri paesi della regione, una lingua che tradizionalmente non ha ricevuto molta attenzione nei modelli linguistici dell'intelligenza artificiale.
Il programma di modelli linguistici di Van Heerden e Bas, chiamato AfriKI, per “Afrikaanse Kunsmatige Intelligensie”, l'intelligenza artificiale afrikaans, sta esplicitamente cercando di migliorare, piuttosto che spostare, il lavoro umano.
“Mentre [la generazione del linguaggio naturale] nella sua ricerca della piena automazione può disapprovare il coinvolgimento umano, la nostra struttura incentrata sull'uomo fa l'opposto”, scrivono.
“Questo studio dimostra che la collaborazione uomo-macchina potrebbe migliorare la creatività umana.”
AfriKI ingerisce tutte le 208.616 parole di un singolo romanzo in lingua afrikaans, Die Biblioteek aan die Einde van die Wêreld (La biblioteca alla fine del mondo) di Etienne van Heerden.
In un processo che sembra simile a Verse by Verse di Google, AfriKI genera centinaia di frasi in prosa e l'essere umano sceglie quali frasi usare e l'ordine in cui devono essere assemblate in una strofa.
Il risultato sono brevi pezzi che hanno alcune immagini vivide e alcuni usi interessanti della metafora:
Die konstabel se skiereiland
Afrika beve
onheil nell'acqua.
Die landskap kantel sy rug
in sigbewaking en vlam.
Ons oopgesnyde sake
brandtrappe vir die ander state.
Hierdie grond parola intimidasie.
La penisola del conestabile
L'Africa beve
il disastro nell'acqua.
Il paesaggio piega le spalle
in sorveglianza e fiamme.
I nostri affari aperti
scale antincendio per altri stati.
Questo terreno diventa intimidazione.
Come notano gli autori, qui c'è abbastanza linguaggio figurativo e metafora da ricordare alcune scuole di poesia. “Il linguaggio può essere descritto come minimalista, evocativo e astratto, e quindi aperto all'interpretazione, simile alla poesia immaginista e surrealista”.
Fino a un certo punto. Le poesie sembrano ancora per lo più tinte di colori, di pennellate, senza averne un'idea.
È facile vedere la trappola comune a cui soccombono tutti i modelli linguistici. I programmi di machine learning sono macchine di trasformazione: la loro utilità è trasformare alcuni dati di input in output in modo automatizzato.
I modelli linguistici prendono esempio dal testo, come le poesie, e li trasformano in uno spartito che riassume la relazione delle parole nella frequenza della loro co-occorrenza, così come molte altre cose misurabili come la frequenza dei suoni e il conteggio delle sillabe.
Inoltre: AI in sessanta secondi
In questo modo, l'AI esegue un'analisi dei dati azione di compressione, comprimendo intere librerie in pacchetti economici di statistiche. L'atto di decompressione ricostituisce i modelli formali del linguaggio nel testo generato.
Ciò che sfugge a tale processo è un altro tipo di compressione, la compressione di associazioni del poeta umano su una scala molto più ampia. La poesia gioca ai margini delle cose e il non detto è ciò che può così emergere.
Ecco Romeo e Giulietta che si innamorano l'un l'altro con un gioco di parole:
ROMEO: Se profanisco con la mia mano più indegna
Questo santo santuario, il peccato gentile è questo
Le mie labbra, due pellegrini arrossati, sono pronti
A levigare quel tocco rude con un bacio gentileGIULIETTA: Buon pellegrino, ti sbagli troppo la mano,
Che la devozione educata mostra in questo;
Poiché i santi hanno mani che le mani dei pellegrini toccano,
E palmo a palmo è il bacio dei santi palmi.
Le linee contengono non solo il rapporto formale tra suono e immagini nella struttura interna. Contengono anche il gioco di capovolgere le idee, guardarle da diverse angolazioni, rifrangerle come luce.
Se ciò possa essere catturato in un modello statistico, forse più sofisticato, è una domanda interessante. Ma in questo momento, lo stato dell'arte nell'IA non coglie il punto.
L'omaggio è il modo in cui i ricercatori di intelligenza artificiale parlano dei loro sforzi. I vari algoritmi del linguaggio stanno tutti lavorando sul “problema della generazione di poesie”, come dice un articolo. Ma generazione è probabilmente il termine sbagliato.
Nelle sue Lettere a un giovane poeta, Rilke ha scritto dell'importanza della solitudine come qualcosa che spoglia gli affari del mondo, mettendo in chiaro ciò che è essenziale.
Consideriamo ancora il primo verso delle Elegie duinesi di Rilke:
Wer, wenn ich schriee, hörte mich denn aus der Engel Ordnungen?
Chi, se piangessi, mi ascolteresti nella gerarchia degli angeli?
Il romanziere William Gass ha detto che Rilke non ha generato le Elegie tanto quanto le ha ricevute.
“Le Elegie di Duino non sono state scritte”, osserva William Gass, “erano attese”, come lo cita il critico Lewis Hyde. (Lo stesso Gass ha affermato che la sua preoccupazione per le qualità formali della scrittura era una fase infantile, un ostacolo. “Fu solo quando fui pronto per uscire dalla mia fase formale che iniziai a leggere Rilke”, ha detto. /p>
Il poeta umano, piuttosto che essere una macchina di trasformazione, è qualcosa di più simile a un'antenna finemente sintonizzata, che capta ciò che è già là fuori. La solitudine di cui parlava Rilke permette quel tipo di attenzione.
L'IA, come macchina di trasformazione, corre nella direzione opposta della solitudine, della quiete, del silenzio. L'IA in un certo senso teme il vuoto. Il suo obiettivo è ricostituire l'informazione totale, i Big Data. Il più delle volte, il linguaggio automatico non può fare a meno di aggiungere più cose.
Alcuni studi sull'intelligenza artificiale riconoscono apertamente gli svantaggi della semplice replica delle qualità formali. Uno studio condotto da ricercatori IBM nel 2018, chiamato Deep-Speare, ha chiesto ai lavoratori della folla umana di giudicare se un sonetto shakespeariano fosse effettivamente di The Bard o fosse generato da una macchina.
Mentre molte poesie della macchina sono state giudicate di successo per motivi formali – rima e metrica, diciamo – i lavoratori della folla umana hanno trovato le poesie insoddisfacenti in termini di impatto emotivo. Così ha fatto un professore di inglese, Adam Hammond dell'Università di Toronto.
Come scrivono gli autori,
Nonostante la forma eccellente, l'output del nostro modello può essere facilmente distinto dalla poesia scritta dall'uomo a causa del suo minore impatto emotivo e leggibilità. In particolare, ci sono prove qui che la nostra attenzione alla forma in realtà danneggia la leggibilità delle poesie risultanti.
Tuttavia, la predilezione dell'IA per il sovraccarico di informazioni non farà che aumentare man mano che sempre più studiosi sottoporranno la poesia umana a tecniche analitiche che impiegano massicce indagini di testi, che possono quindi essere affettati e tagliati a dadini.
Ad esempio, Thomas Nikolaus Haider dell'Università di Stoccarda e Steffen Eger dell'Università tecnica di Darmstadt, nel 2019 hanno compilato un corpus di 75.000 poesie in tedesco di 269 autori, dal XVI secolo ad oggi . È “il più grande corpus di poesie fino ad oggi”, osservano.
Gli autori hanno analizzato i “tropi” nelle poesie, il significato, i modelli di espressione di un dato concetto nel linguaggio che si ripetono – ancora una volta, cose che possono essere quantificate.
Utilizzando una tecnica familiare di apprendimento automatico, in cui le giustapposizioni di parole ricevono un punteggio numerico, gli autori hanno scoperto che tropi come l'espressione “l'amore è magia” hanno una prevalenza crescente nel periodo romantico tedesco, nel XVIII e XIX secolo. Lo paragonano a frasi che hanno un valore in diminuzione, come “i tamburi dell'amore”.
Il punto è che lo studio della statistica della poesia, reso possibile da vaste raccolte di dati e da nuovi strumenti analitici, sostiene l'idea che ci siano modelli, almeno formali, che stanno alla base dell'impulso creativo , e che quindi deve esserci qualcosa che può essere catturato dal programma appropriato.
La battuta finale di tutto questo è che la maggior parte degli umani sembra incapace di distinguere tra la scrittura di una macchina e quella di una persona, e se possono dirlo, non necessariamente gli importa.
In un articolo di gennaio, intitolato in modo divertente “Intelligenza artificiale contro Maya Angelou: prove sperimentali che le persone non possono differenziare l'intelligenza artificiale dalla poesia scritta dall'uomo”, Nils Köbis e Luca D. Mossink dell'Università di Amsterdam e l'istituto Max Planck ha chiesto alle persone di scegliere quale preferissero tra due poesie che iniziavano ciascuna con lo stesso verso, una completata da una persona e una completata da GPT-2.
Attraverso molteplici configurazioni di test, gli autori hanno scoperto che “le persone non sono in grado di identificare in modo affidabile i contenuti creativi umani rispetto a quelli algoritmici”.
Inoltre, molte persone hanno dimostrato di stare bene con le poesie create dalla macchina anche quando è stato detto loro in anticipo che stavano leggendo il lavoro di un algoritmo.
In un altro studio, Andrea Zugarini e colleghi delle Università di Firenze e Siena nel 2019 hanno generato terzine, un'unità di tre versi all'interno di una poesia, e hanno sfidato gli umani a raccontarle dalle terzine di Dante Alighieri nel suo capolavoro poetico La Divina Commedia.
Gli ingenui giudici umani, quelli senza un particolare background negli studi danteschi, giudicarono le terzine generate come realmente scritte da Dante quasi la metà delle volte, in pratica, un lancio di moneta. Gli esperti di Dante se la sono cavata meglio.
Zugarini e colleghi concludono che il loro lavoro è in grado di “mantenere il metro e la filastrocca della Divina Commedia” anche se fallisce sotto altri aspetti.
Man mano che i ricercatori migliorano sempre di più nella costruzione di tali valutazioni formali, in cui gli umani sono disposti ad accettare come valida una macchina che si avvicina a qualità superficiali, allora le preoccupazioni dell'arte umana possono svanire.
Quindi, potrebbe essere avviata una sorta di età dell'oro della collaborazione umana e IA, con distici, terzine e quartine che esplodono sulla scena più velocemente di quanto si possa dire
tanto dipende
da
una ruota rossa
carriola
da leggere
Etica dell'IA: vantaggi e rischi dell'intelligenza artificiale
La scala crescente dell'IA sta alzando la posta in gioco per importanti questioni etiche.
Ulteriori informazioni
Argomenti correlati:
Digital Transformation CXO Internet of Things Innovation Enterprise Software Smart Cities