Intelligenza Artificiale Generativa “milquetoast”? No, grazie!

di Ennio Bianco.

Intelligenza Artificiale Generativa “milquetoast”? No, thanks!
di Ennio Bianco.

Oggi ho appreso il significato di una nuova parola: “Milquetoast”.
L’etimologia ci dice che deriva da una ricetta (immagino, tipicamente americana): del pane tostato imburrato e servito in un piatto di latte caldo. Questo termine, usato come aggettivo o sostantivo, ebbe fortuna come cognome di un personaggio dei fumetti creato nel 1924 da Harold T. Webster: Caspar Milquetoast, appunto. Un mite, pigro, scialbo, scipito, proprio come un toast al latte.

Oggi, la critica culturale lo usa ampiamente per definire l’insipidezza che si percepisce nell’arte contemporanea, così come nella musica, nei film, nella letteratura, nella moda, nel giornalismo, nel cibo, in particolare dalla produzione di contenuti generata dall’Intelligenza Artificiale Generativa (GAI).

Il recente libro di Kyle Chayka, “Filterworld: How Algorithms Flattened Culture” tenta di fornire una spiegazione alla situazione che si è venuta a creare negli ultimi anni e che sembra incanalare i processi culturali in un unico enorme frullatore dal quale inevitabilmente esce una poltiglia insapore, incolore, inodore, milquetoast appunto. Tutto deriva, a suo parere, dalle raccomandazioni algoritmiche, vale a dire quei consigli non richiesti, ma che il più delle volte accettiamo, finendo così per incentivare solo alcuni specifici contenuti.

Questi particolari algoritmi consigliativi non provano minimamente a premiare o valorizzare la qualità, dal momento che non sanno cosa sia. Essi infatti si basano su numeri, su concetti probabilistico matematici, mentre la qualità è soggettiva ed è difficile da misurare, da quantificare. Il loro obbiettivo è alimentare invece l’unico parametro che domina il mondo della rete: il coinvolgimento.

Kyle Chayka in una intervista a NPR del 17 gennaio 2024: “Non sempre consumiamo attivamente la cultura e pensiamo profondamente alla genialità di un dipinto o di una sinfonia. Non è qualcosa che possiamo fare sempre. Ma quello che mi preoccupa è la passività del consumo a cui siamo stati spinti, il modo in cui siamo incoraggiati a non pensare alla cultura che stiamo consumando, a non seguire le nostre inclinazioni. E alla fine di tutto questo è che non vedremo mai un film di Fellini che ci sfida così intensamente da dover pensarci su per il resto della vita, così come non vedremo mai quel dipinto così strano e sconfortante da rimanerci impresso. E’ come volessimo lasciare indietro quei capolavori d’arte solo perché non coinvolgono immediatamente molte persone.”

Senza alcun dubbio condivido l’analisi di Kyle Chayka, una acuta osservatrice del mondo internet e di come i social media, con i loro algoritmi e suggerimenti, finiscono per influenzare la cultura.

Anch’io infatti, come attento osservatore della produzione di immagini da testo/prompt, grazie alle ormai famose applicazioni come: DALL-E 3, Imagen, Stable Diffusion, Midjourney, Firefly, Perfusion, ecc., cerco quotidianamente di valutare l’evoluzione di questo flusso immane (sembra che in poco più di un anno e mezzo ne siano state prodotte oltre 15 miliardi) e la sensazione che provo è, nella stragrande maggioranza dei casi, di déjà vu, di una esperienza creativa povera di idee, tesa a generare un sentimento di stupore fine a se stesso, in conclusione un bel “milquetoast”.

Non passa giorno che non vengano pubblicati articoli che suggeriscono come realizzare immagini fotorealistiche, oppure stili, combinazione di stili, stili di artisti, così come palette di colori e trucchi vari, o simulazioni di texture e materiali, o ancora illustrazioni, graphic novel, caratteri, loghi, e poi cibo, animali, biomorfismi, ecc. ecc. ecc.

Quando queste applicazioni text-to-image passano da una release ad un’altra, per esempio dalla 4 alla 5.1 di Midjourney, poi a 5.2, poi a 6, ecco allora aprirsi una diga di nuove immagini, più realistiche, più perfette, con dettagli che nemmeno il più grande fotografo professionista riuscirebbe a mostrarci, per esempio – concedetemi l’ironia – con le persone che possono reggere un calice senza dover usare sei o sette dita della mano. Già perché produrre mani coerenti, vale a dire proporzionate e con cinque dita, è un po’ il limite di tutti i generatori di immagini.

La creatività e il considerare le immagini così generate una forma d’arte, l’AI Art appunto, sono diventati i temi chiave che dominano il dibattito sulla Intelligenza Artificiale Generativa.

Ora, non c’è dubbio che la ricerca artistica possa muoversi anche attraverso questo strumento, quello che a mio parere risulta difficile è trovare qualcosa di originale, di significativo, che offra spunti di riflessione sui grandi temi che sta affrontando il pianeta: l’antropocentrismo, le guerre, le pandemie, le migrazioni di massa, le discriminazioni razziali, di genere, di orientamento sessuale, di età, di disabilità, ecc., l’affermazione di illusionisti politici e commerciali, la pervasività e l’etica dell’A.I..

Osservo invece una sterminata produzione di paesaggi onirici, favolistici, cyberpunk, distopici, amine, ecc. che hanno il sapore del toast al latte e vengo preso dallo sconforto e spesso mi chiedo come siamo arrivati a questo punto. Ecco perché ho trovato molto acuta l’analisi di Kyle Chayka.

Potrei quindi concludere qui questo articolo, ma finirei per trasmettervi un senso di amarezza e di sconfitta. Invece va chiarito che non tutto il panorama è così piatto, che ci sono le eccezioni, che ci sono dei veri artisti, che sono partiti da lontano e con grande pazienza hanno cercato di capire come esprimersi con questi nuovi strumenti. Già, perché di strumenti si tratta!

Dal momento che il processo di valorizzazione dell’arte nasce dalla discussione e dal coinvolgimento, oltre che degli addetti ai lavori come Gallerie, Musei, Centri Espositivi, Collezionisti, anche del vasto pubblico che segue i giornali specializzati, vi propongo le opere un paio di artisti agli antipodi del confort zone milquetoast. Si tratta di Carmine Calvanese e Marco Cardioli.

Commentare le opere di Carmine Calvanese, è in fondo, come lui stesso ha ammesso in un recente intervista, specchiarsi nella sua anima, là dove è rimasto fin dall’infanzia il desiderio di poter giocare, in senso totale, costruendo e decostruendo, combinando forme e colori, luoghi e tempi.

Offrire una chiave di lettura della sua opera può apparentemente sembrare una cosa facile, in fondo basta abbandonarsi ai suoi mondi meravigliosi e alla leggerezza, che in Calvanese non è mai superficialità, anche perché continui sono i rimandi culturali, le citazioni, i simbolismi.

Quello di Carmine Calvanese è, anche e soprattutto, un discorso critico che riguarda i linguaggi dell’arte contemporanea, che egli trova spesso monotoni, e non in grado di coinvolgere vasti strati della popolazione.

Quali sono le immagini che coinvolgono un vasto pubblico?”, si chiede, e osserva che sono quelle che utilizzano una vivace palette di colori e di forme, quelle che esprimono un bisogno di felicità, di spensieratezza, di velocità, di emozioni.
L’immagine non può che durare un attimo – egli afferma – e poi va accartocciata, cancellata, rigenerata, in un continuo e serrato ciclo vitale. Un battito di ciglia. Nessuna eternità.”
Se è così, egli afferma, se è questo che serve per farsi comprendere dal grande pubblico allora non resta che prenderne atto e agire. L’arte deve passare di lì per rinnovare il proprio linguaggio.

Permettetemi di azzardare una analogia con quanto successe negli USA nei primi anni ’60 con la nascita della Pop Art in risposta alla pervasività dello spirito consumistico. Un gruppo di artisti decisero che per comunicare era necessario utilizzare il linguaggio della pubblicità, della serialità, dei giornali patinati, della TV, dei supermercati. Un linguaggio immediato, scarnificato di ogni elemento decorativo, persino grezzo, ma efficace, comprensibile a tutti.
Pensiamo per esempio a come Andy Wharol che attraverso le serie “Electric chairs”, “Rice riot” e “Dollars sign”, è riuscito a veicolare ad un grande pubblico tematiche come la pena di morte, le rivolte razziali e la mercificazione dell’arte.
Ed ecco come cerca di comunicare Carmine Calvanese, attraverso il grande ciclo “Vi-a-mare” gli orrori della guerra, delle guerre.

Nella prima parte del ciclo “Vi-a-mare (polittico delle delizie sugli orrori della guerra)” troviamo al centro la magica fontana dei miracoli, costruita per il trionfo dei sensi, per la gioia, il piacere e la felicità assoluta. Una potente calamita per coloro che, al di là del mare, ne hanno sentito parlare, e decidono di attraversarlo. Eccoli lì, in basso a sinistra, i naufraghi con la braccia alzate che disperatamente stanno gridando “aiuto!”. Sulla destra un grande aereo di cioccolata, fondente e al latte, sgancia biscotti, fragole, tavolette di cioccolata, dolciumi vari, sulla città provocando morte e distruzione. Sulla sinistra la scena si ripete con un aereo di pasta secca, che sgancia tagliatelle, spaghetti, rigatoni, sulle città e le devasta. C’è in queste due immagini, oltre ad un formidabile carico di ambiguità visiva e forte perplessità sui tempi dei bombardamenti e degli aiuti umanitari. La lettura va inevitabilmente al presente, a ciò che sta avvenendo a Gaza.

Nella seconda parte del ciclo la fontana magica si trova sulla sinistra ed ha la forma di un immane cono “gelato” con in cima, a sugellare questa meraviglia, il bacio dei due amanti. La fontana si erge su una grande torta che galleggia in un mare di morti per “congelamento”. Lo stesso tappeto di corpi che sta alla base del riquadro centrale. Su di essi si stagliano dei grattacieli e nella sommità degli amanti di abbracciano. La vita, sembra indicare Calvanese, alla fine prevale. Le teste sono decorate con il fiore della speranza: l’azalea. Infine, nel terzo riquadro troviamo le pale eoliche e ancora gli amanti, l’energia del vento e dell’amore, e il mare, ormai rasserenato, accoglie l’omaggio dei fiori, l’omaggio alla speranza.

Marco Cadioli – Apocalisse 4:8. I quattro esseri viventi hanno ciascuno sei ali, intorno e dentro sono costellati di occhi; giorno e notte non cessano di ripetere: Santo, santo, santo il Signore Dio, l’Onnipotente, Colui che era, che è

Il senso dell’Apocalisse incombente esplode in pieno nei ritratti di Marco Cadioli.
Per spiegarvi il suo lavoro vi propongo una intervista inedita realizzata qualche mese fa.

[Ennio Bianco]: Le immagini che proponi sono generate con applicazioni text-to-image fornendo come prompt i versetti dell’Apocalisse. Detto così sembra tutto semplice.

[Marco Cadioli]: Innanzi tutto c’è da sfatare l’idea per cui si scrive un prompt e l’immagine esce pronta e perfetta. Così, da sola, come per miracolo. E’ stato un processo lungo, altro che pappagallo [ndr spesso si afferma che gli LLM Lange Language Model operino come un pappagallo, cioè ripetano ciò che hanno già appreso senza aggiungere nulla di diverso], ci sto lavorando da mesi e tu lo puoi testimoniare.

Le immagini interpretano perfettamente il senso dell’Apocalisse incombente!

Qui, scusa l’auto citazione, ma questo è il lavoro dell’Artista. Quali versetti scegliere immaginando come verrà il risultato? Leggere 30 volte l’Apocalisse prendendo appunti. Scegliere una estetica, la fotografia in B&N, curata, in certi casi quasi da studio, indicando le luci, isolando i soggetti. Avere in mente quali risultati si vogliono, quindi essere super selettivi nella scelta. Vorrei farti vedere molte delle immagini scartate per farti comprendere meglio il processo creativo e, se permetti, anche la dimensione quantitativa del lavoro.
Si tratta di non fermarsi ad un unico strumento, le immagini provengono da diverse piattaforme, perché al centro ci sono le scelte estetiche e la coerenza dei risultati. Non è l’estetica imposta dal software che deve emergere. Sono da evitare le immagini stereotipate di un futuro distopico, cinematografico, o catastrofico. In questi mesi assistiamo ad una massiccia produzione di immagini apocalittiche dal mondo reale, per cui sentivo il bisogno di avere qualcosa di lirico, quasi di astratto, che desse, come dici tu, il senso di una Apocalisse incombente.

Marco Cadioli – Apocalisse 19:12. I suoi occhi sono come una fiamma di fuoco, ha sul suo capo molti diademi; porta scritto un nome che nessuno conosce all’infuori di lui.

Ti sei chiesto l’origine di questa immaginazione dell’AI?

Cerco di entrare in empatia con la macchina. Ad esempio le AI sono molto brave a mischiare i soggetti, a fondere i concetti, prendere pezzi da infinite fonti e farne un’unica immagine. Una delle prime immagini diffuse da DALL-E era una poltrona a forma di Kiwi.
Ora, se rifletti sul prompt che riporta il versetto dell’Apocalisse 4:8, pensi subito alle immagini delle cavallette. La descrizione di “una locusta”, con l’aspetto “di cavalli”, il volto “come quello degli uomini”, e “capelli come di donne”.
Ho cercato di far emergere dall’AI questa fusione di elementi diversi, probabilmente ciascuno viene da contesti diversi, non c’è una unica fonte, non so se c’è in rete una immagine così, ma non credo. E queste diverse provenienze si fondono per creare una immagine nuova che prima non c’era. Io credo che sia andata così, singoli concetti conosciuti, cavalletta, cavallo, donna, che si sono remixati in un risultato incredibile.

Marco Cadioli – Apocalisse 13:1. Vidi salire dal mare una bestia che aveva dieci corna e sette teste, sulle corna dieci diademi e su ciascuna testa un titolo blasfemo

Dalla tua risposta avverto che spesso tu stesso rimani stupito e rapito dai risultati…

E’ vero. Spesso i risultati mi hanno sorpreso, spiazzato, sono andati oltre la mia immaginazione. Gli elementi che ho fornito, già di loro molto immaginifici, si sono fusi a volte in modo prevedibile e corretto da un punto di vista logico, a volte in modo imprevedibile, magari scorretto formalmente, ma di grande impatto. E’ tra le immagini più imprevedibili che ho trovato i maggiori stimoli, quelle che hanno messo in evidenza il processo che ha collegato le immagini del testo, la mia traduzione in elementi per le AI, e l’interpretazione degli algoritmi con tutti gli “errori” e scarti di senso che hanno aggiunto.

Marco Cadioli – Apocalisse 9:7.8. Queste cavallette avevano l’aspetto di cavalli pronti per la guerra. Sulla testa avevano corone che sembravano d’oro e il loro aspetto era come quello degli uomini. Avevano capelli, come capelli di donne, ma i loro denti erano come quelli dei leoni

Come si può osservare quest’opera che non ha nulla a che vedere con le immagini stereotipate di un futuro distopico, cinematografico, così diffuse sui canali social network, semmai vi si trovano gli echi di Kubin.
Cerco di entrare in empatia con la macchina, – mi risponde Marco Cadioli quando gli chiedo l’origine di questa immaginazione – ad esempio le AI sono molto brave a mischiare i soggetti, a fondere i concetti, prendere pezzi da infinite fonti e farne un’unica immagine. Pensa alle immagini delle cavallette. La descrizione di “una locusta”, con l’aspetto “di cavalli”, il volto “come quello degli uomini”, e “capelli come di donne”.
Egli ha intuito una possibilità creativa dell’applicazione text-to-image, cercando di far emergere una fusione di elementi diversi, probabilmente ciascuno proveniente da contesti diversi, non da una unica fonte. Grazie a queste diverse provenienze che si fondono si genera una immagine nuova che prima non c’era. “Io credo che sia andata così, singoli concetti conosciuti, cavalletta, cavallo, donna, che si sono remixati in un risultato incredibile.”, conclude.
Ennio Bianco

Immagine in evidenza
Carmine Calvanese – Vi-a-mare (polittico delle delizie sugli orrori della guerra), seconda parte” (2023/2024) Tecnica: software ai text-to-image, photoshop beta, stampato su dibond. Misure: cm130xcm100 cadauno. Misura totale: metri 1,30 x metri 6
Copyright
tutte le immagini © dei rispettivi Autori
Contatti e riferimenti
Marco Cadioli | Carmine Calvanese