Ammaestrare il linguaggio per produrre immagini

Ammaestrare il linguaggio per produrre immagini
[Tempo di lettura: 7 pignalenti]

Ho chiesto a Chat GPT, con il comando più neutro e generico possibile, di scrivere l’introduzione a questa intervista. Ecco il risultato:

Nel mondo in rapida evoluzione delle tecnologie dell’Intelligenza Artificiale (IA), il dibattito sul ruolo degli autori e il valore del copyright rivestono un’importanza sempre maggiore. Le Intelligenze Artificiali adattative (TTI), capaci di apprendere e sviluppare autonomamente soluzioni in risposta a nuove sfide, stanno ridefinendo i paradigmi tradizionali della creazione e della proprietà intellettuale. In questa intervista, ci immergeremo nel cuore di questa discussione affascinante, esplorando il ruolo cruciale degli autori nel contesto delle TTI e riflettendo sul valore del copyright in un ambiente sempre più dominato dall’IA. Ciò che emerge è un panorama complesso, in cui la creatività umana si intreccia con l’intelligenza artificiale, portando con sé nuove sfide e opportunità. Parleremo con esperti del settore per comprendere come gli autori possano navigare su questo terreno in evoluzione, preservando l’unicità delle proprie opere e assicurandosi che il valore del loro contributo sia riconosciuto e tutelato. Attraverso questa conversazione, cercheremo di gettare luce su uno dei dilemmi più urgenti del nostro tempo: come bilanciare l’innovazione tecnologica con il rispetto per la creatività umana e il diritto di proprietà intellettuale.

Le Intelligenze Artificiali, per produrre contenuti di qualsiasi tipo, pescano nel grande mare di dati e informazioni a loro disposizione. Sappiamo quindi che questi prodotti non sono neutri – anzi sono radicati al contesto di produzione dei dati – né, d’altra parte, in nessun modo “originali”. Infatti, un testo apparentemente di servizio come quello qui sopra, scritto anche un po’ male, contiene moltissimi preconcetti sull’idea di autore (inteso come creatore), di opera (un prodotto unico e con uno specifico valore), di Intelligenza Artificiale stessa (strumenti che trovano soluzioni a nuove sfide), oltre a far trapelare una posizione sul diritto d’autore piuttosto conservatrice. Francesco D’Isa, scrittore e illustratore, lavora da qualche anno con le intelligenze artificiali soprattutto per la produzione di immagini. Ha organizzato varie mostre di opere prodotte con le IA e a novembre 2023 ha pubblicato Sunyata (Eris) una storia a fumetti generata interamente dalle IA. Con lui ho discusso delle stesse questioni che pone in modo velato il testo prodotto da Chat GPT.

Partirei da una domanda piuttosto generica per entrare nella conversazione: cos’è per te un autore? Come concepisci la creatività?

Dividerei il concetto di autore in due parti. La “funzione autore” ha dei caratteri per lo più economici, storici e reputazionali: serve affinché venga retribuito e riconosciuto pubblicamente, affinché si possano ricondurre da un punto di vista storico dei lavori a delle persone e per posizionarlo in società. Al netto di queste tre funzioni, squisitamente sociali, non esiste secondo me una funzione ontologica dell’autore, non esiste mai qualcuno che da solo ha creato qualcosa. Ogni opera d’arte per me è collettiva. Ti faccio l’esempio di Guernica: se prendi l’opera e togli tutto ciò che non ha a che fare con Picasso (la Seconda guerra mondiale, le influenze dell’arte africana, la fisica del XX secolo, gli artisti a lui contemporanei e passati e così via), non ottieni Guernica. Se Picasso fosse nato nel 1300 avrebbe forse disegnato delle bellissime Madonne. In certo senso, quindi, l’autore è una delle tante concause che portano alla nascita delle opere, senz’altro una delle più importanti ma forse nemmeno la più importante di tutte. Il processo collettivo di creazione di un’opera è stato completamente dimenticato dagli artisti occidentali, immersi in una società individualista attaccata all’idea di “genio”, mentre in Oriente fa parte della cultura in maniera più radicata. 

Secondo te è possibile scrivere una storia dell’arte basata non tanto sulle idee, ma sulle rivoluzioni tecniche? Credi che la periodizzazione che usiamo attualmente sarebbe diversa o più o meno la stessa? 

È evidente che il progresso tecnico influenza in maniera inscindibile, anche se non esclusiva, l’arte: tutta l’arte del Novecento non sarebbe la stessa senza la fotografia, ad esempio, o quella moderna senza la stampa. Sono d’accordo però con Valentina Tanni quando ha dichiarato, in un’intervista su Artribune, che le nuove tecnologie non influenzano gli artisti di per sé o perché debbano necessariamente usarle. La funzione della tecnologia, piuttosto, è cambiare la visione del mondo nel suo complesso: anche se un pittore del Novecento non ha mai usato la fotografia, ha vissuto comunque in un contesto in cui essa esisteva e in cui quindi, di conseguenza, le persone reagivano alle immagini con la consapevolezza che esistesse. 

Le tecnologie TTI operano la rivoluzione per me più interessante non tanto nella pura produzione di immagini (credo che non esistano immagini prodotte dall’intelligenza artificiale che un uomo non possa riprodurre o immaginare), quanto nell’uso del linguaggio. Non ricordo a memoria altre forme artistiche in cui il linguaggio debba essere ammaestrato per produrre fisicamente un’immagine e non ricordo una connessione generativa così diretta tra testo e immagine. Questo che cambiamenti cognitivi e ontologici comporta secondo te?

La definizione che amo di più per descrivere il processo di cui parli è “iconogenesi attraverso attrattori semantici”: le parole dei prompt non funzionano come quelle che stiamo usando io e te per parlare, ma ogni parola influenza, in qualche modo, tutta l’immagine, porta i pixel in direzione di quella parola. I prompt possono essere sia positivi che negativi: puoi dire alla macchina sia cosa fare sia cosa non fare. Io, ad esempio, tra le parole a cui la mia immagine non deve riferirsi, metto sempre “farfalle”, perché l’immagine delle farfalle è legata a tantissime opere kitsch che l’intelligenza artificiale si è “mangiata”. Se tu levi le farfalle non rimuovi soltanto il soggetto ma anche tutto quell’immaginario di riferimento. Allo stesso modo, se inserisci in maniera positiva “corvo”, l’immagine diventa più dark. Le parole sono usate come se fossero calamite, delle attrazioni per spostare il fulcro dei pixel verso una determinata direzione. Il potere di una singola parola di influenzare tutto il contesto non esiste nel linguaggio quotidiano in maniera così forte.

E parole come articoli, preposizioni, connettori e elementi sintattici simili che funzione hanno?

Di fatto non si sa, non c’è ancora una risposta chiara: c’è chi dice che non servono a niente, ma io non so se siano del tutto inutili. Ad esempio, mi accorgo che le virgole hanno un significato per la macchina, perché separano un po’ le parole e di conseguenza le “fasi” di creazione di un’immagine, mentre la maggior parte delle preposizioni e articoli sembrerebbero più insignificanti. 

Tu scrivi spesso che uno dei tuoi interessi principali nell’uso delle tecnologie TTI è quello di far “impazzire” la macchina. Cosa intendi e come si produce un effetto del genere tramite il linguaggio?

Mi interessa creare contrasti molto forti nelle immagini che produco e per farlo è utile attingere ad attrattori semantici contrastanti, così che l’immagine generata vada in una direzione ma anche nell’altra: nel mezzo vengono fuori i risultati più originali. Ci sono due difficoltà nella produzione delle immagini: la prima è evitare la censura, cosa che in alcuni software è quasi impossibile. Non è tanto un problema di soggetto (non necessariamente voglio rappresentare un uomo nudo), quanto di aree semantiche, inserire le mie immagini in degli spazi latenti, ad esempio legati all’erotismo o alla violenza. La seconda è evitare, al contrario, le zone eccessivamente comuni o troppo stereotipate. Come elementi negativi, ad esempio, inserisco spesso fantasy e fantascienza, perché la maggior parte delle immagini che l’IA ha “mangiato” così etichettate sono delle pataccate. 

Se un giorno l’uso delle IA fosse istituzionalizzato e insegnato nelle accademie, quali sarebbero le preconoscenze fondamentali per lo studio della materia?

Ci sono già dei corsi che lo fanno. La LABA di Brescia, dove insegno io, ha inserito un insegnamento sulle IA in un corso tradizionale di pittura, un approccio abbastanza avanguardistico. Quello che ho notato è che gli studenti non hanno preconcetti. Sto ancora indagando tutti i requisiti: ci vogliono una buona competenza visiva, come in qualsiasi ambito artistico, e una buona tecnica verbale. Gli studenti che hanno migliore proprietà di linguaggio se la cavano meglio, riescono meglio a “montare” le parole. Non servono competenze tecniche del disegno, ma una buona capacità di scrittura. Trovare il giusto prompt, comunque, non è tutto. Bisogna scegliere che immagine realizzare, spesso tra centinaia di possibilità. Le tecnologie, specie i software più potenti, si stanno sviluppando molto velocemente con funzioni sempre più accurate. Ho notato comunque che i miei studenti, che sanno disegnare, tendono già a ibridare IA e tecniche più tradizionali, ad esempio promptando a partire dai disegni o, al contrario, facendo disegni a partire da immagini generate dalle IA. Il futuro starà molto probabilmente nell’ibridazione. 

In Sunyata ci sono molte immagini consecutive che differiscono apparentemente per pochi dettagli, come una leggera trasformazione dei volti o uno spostamento del corpo. Mentre è facile immaginare una modifica del genere con strumenti analogici, quanto è complesso questo processo con mezzi digitali? Ad esempio, è possibile “salvare” uno sfondo e poi lavorare solo sulla figura? Si può far memorizzare alla macchina il tuo stile? 

Nessun software attualmente disponibile ha memoria delle immagini generate, succede soltanto con ChatGPT per i testi. Per ogni immagine bisogna rifare tutto, magari ripartire dallo stesso prompt e modificarlo leggermente. Bisogna cercare di vincolare le immagini a uno stile preciso: è facile se lavori a partire da uno stile famoso, ad esempio quello di alcuni tipi di anime, meno se cerchi una strada più personale. 

La tua posizione sul copyright è piuttosto chiara, hai esposto in più sedi i rischi che deriverebbero dalla privatizzazione dei mezzi di produzione delle IA in mano a pochissime aziende che detengono i diritti delle immagini. Mi sorprende, a questo proposito, la tendenza che sta assumendo la privatizzazione dei diritti d’immagine di opere d’arte che sono ormai patrimonio dell’umanità, come nel caso del David di Michelangelo. Che relazione ci deve essere secondo te tra la disponibilità di IA open source e la creazione, attraverso questi mezzi, di opere d’arte?

Io penso che quello che vorrei non accadrà. La cosa più probabile è che ci sarà una stretta sempre più forte sui diritti d’autore. Fino a venti anni fa sarebbe stato assurdo pensare che l’immagine del David di Michelangelo fosse protetta dal copyright, ora questa posizione ha vinto in tribunale. Trovo orrendo che un ente si arroghi il diritto d’immagine di un’opera il cui autore è morto da 500 anni. Credo che i grandi giornali e i grandi gruppi editoriali, vedendo sfruttato il loro patrimonio per la creazione di immagini con le IA, vogliano la loro fetta di soldi e che in qualche modo la otterranno. Si tratta di aziende miliardarie che vogliono soldi da altre aziende miliardarie. Solo qualche grande artista guadagnerà qualcosa dal copyright, come sempre i piccoli artisti e i giornalisti comuni non ne ricaveranno nulla. La speranza di alcuni è che limitando le immagini a disposizione le IA “rallentino”, che diminuisca cioè la qualità delle immagini in modo direttamente proporzionale alla riduzione della quantità di dati a disposizione dei software. Secondo me non andrà così, sarà più probabile che aziende che hanno i soldi facciano accordi con altre aziende che detengono molti diritti, ad esempio con la Disney negli USA. Si pone inoltre il paradosso delle piattaforme open source: io, come milioni di altre persone, ho installato sul laptop IA aperte, senza censura e gratuite. Se per assurdo diventassero illegali chi potrebbe in modo retrospettivo toglierle dalla circolazione? La pirateria non morirà non appena sarà dichiarata illegale e noi potremmo avere il paradosso di software open source pirata che funzionano meglio di quelli legali. 

Quali sono le artiste e gli artisti che apprezzi di più nel loro lavoro con le IA?

Ho lavorato con Fabrizio Aiello e Piero Fragola a Firenze, da dove viene anche Roberto Beragnoli; a Monza invece ho collaborato con Andrea Meregalli. Fuori dall’Italia citerei Von Wolfe, che usa l’IA per generare immagini a partire dalle quali crea dei quadri ad olio, Will Toulan, Stephan Vasement, Gom Tollum, Katie Morris, Douggie Pledger, Lev Manovich. Su un account Instagram che si chiama promptforum si possono trovare tanti altri nomi interessanti. 

Condividi: