Il tema si presta ad essere analizzato sotto diversi punti di vista e riesce ad interessare numerose persone poiché mette in discussione uno dei pilastri dell’umanità stessa: la capacità di creare opere artistiche. Recentemente la questione è ritornata alla ribalta dopo che ChatGPT, grazie al suo modello GPT-4o, è riuscita a riprodurre lo stile artistico del famoso Studio Ghibli. La questione ha suscitato molto interesse sia fra gli utenti sia tra la stampa e ha preso le mosse in particolare da alcune dichiarazioni di Hayao Miyazaki (uno dei fondatori di Studio Ghibli) del 2016 in cui, molto esplicitamente, definiva l’uso dell’IA nel campo artistico un insulto alla vita stessa. L'intervento dell'artista giapponese è stato però decontestualizzato dato che Miyazaki non faceva riferimento ai modelli attuali ma ad una tecnologia diversa pensata per un uso differente (qui il video originale). Questo piccolo caso, tuttavia, è utile per sottolineare quanto questo tema sia polarizzante e inquinato da opinioni in conflitto d’interesse che rischiano d’influenzare negativamente l’opinione pubblica a proprio piacimento. In questo senso è utile cercare di ragionare sull’argomento, senza adottare il punto di vista degli artisti o delle aziende, cercando di riflettere da utente interessato a capire come funzionano l’IA e le sue possibili implicazioni. Per farsi un’opinione non ideologica serve, quindi, entrare nel merito cercando di capire i limiti e le potenzialità di questa tecnologia.
Arte ed IA: a che punto siamo?
In un recente studio condotto su circa 600 partecipanti si è verificata la capacità delle persone di distinguere l’arte reale da quella generata dai modelli IA. Le persone dovevano classificare una serie d’immagini, tramite dispositivo mobile, cercando di distinguere quelle create dall’uomo da quelle generate artificialmente. I risultati hanno evidenziato diverse cose interessanti: su 6615 immagini reali (create dall’uomo) circa un terzo (1889) sono state classificate come generate dall’IA. Invece su 6193 immagini generate da IA circa un quinto (1215) sono state classificate come reali. Il database delle immagini IA è stato costruito usufruendo di dodici modelli IA differenti da cui sono emersi come migliori: ChatGPT-4.0, Leonardo Phoenix, MidJourney ed Ideogram. Questi quattro modelli rappresentano circa il 33 per cento del campione d’immagini IA usate nel test, quindi, verosimilmente, in un campione composto esclusivamente da questo tipo di prodotti, gli errori nelle classificazioni come opere umane delle immagini generate artificialmente risulterebbero più alti.
Dalla ricerca, inoltre, è emerso che i modelli IA faticano ancora sotto diversi punti di vista, ad esempio, spesso si riscontrano: inconsistenze nel riprodurre in maniera fedele corpi umani ed animali, soprattutto considerando l’anatomia e le proporzioni dei corpi; perdita di coerenza stilistica, non intenzionale, all’interno dell’immagine creando elementi stilisticamente incompatibili. Infine un ulteriore errore sistematico avviene durante la riproduzione dei colori attraverso saturazioni non realistiche o incoerenti con lo stile dell’immagine. In generale le IA faticano a preservare completamente i dettagli più particolari degli stili artistici; infatti, cadono spesso in errore quando si chiede loro di replicare immagini barocche o rinascimentali dove è richiesto un alto livello di dettaglio, precisione anatomica e coerenza logica. Gli stili che tendono ad essere riprodotti con maggiore fedeltà, e attribuiti con maggiore frequenza all’ingegno umano, sono l’impressionismo e l’astrattismo; ovvero, stili più sporchi in cui risulta più complicato notare possibili errori.
In conclusione l’IA riesce effettivamente ad “ingannare” le persone con un’efficacia notevole solo se si considerano determinati modelli, stili e prompt. La riuscita di un’immagine coerente e credibile, infatti, dipende significativamente dalle descrizioni (prompt) forniti ai modelli generativi. In molti casi non basta chiedere un’immagine in stile impressionista per avere un prodotto credibile, ma serve un prompt dettagliato della scena che si vuole descrivere, dei colori, delle tonalità e anche del materiale su cui si vuol far credere che sia stata fatta l’opera. Senza una descrizione minuziosa risulta decisamente più difficile.
IA e Copyright
Il tema del copyright, probabilmente, è uno dei più controversi e strumentalizzati su cui serve fare chiarezza, per spegnere il panico morale generato attorno all’argomento. Una delle critiche più comuni rivolte all’intelligenza artificiale, applicata all’arte, riguarda la sua presunta violazione del copyright sia nelle immagini che produce sia nella fase di addestramento o apprendimento. Il principio con cui le IA apprendono, tuttavia, non è così distante da quello umano, solo che è enormemente più rapido ed efficiente. Quando un artista vuole migliorare la propria tecnica, cosa fa? Studia immagini, osserva stili, imita, sperimenta, sfoglia archivi, prende spunto e si esercita. Le IA fanno lo stesso: vengono addestrate su enormi archivi di immagini prese dal web, spesso accompagnate da descrizioni testuali. In questo processo, imparano a riconoscere schemi visivi, stili, composizioni. Esattamente come farebbe un disegnatore che si esercita copiando i grandi maestri.
La differenza sostanziale, naturalmente, sta nei mezzi dato che dietro le IA ci sono modelli matematici avanzati, reti neurali e algoritmi di apprendimento automatico. Non c’è né coscienza né intenzione. L’analogia, in ogni caso, permane: sia l’uomo che l’IA imparano osservando ciò che già esiste. Se è vero che molte IA vengono addestrate su immagini protette da copyright, non è forse vero che anche gli esseri umani si formano ispirandosi ad autori precedenti, spesso senza chiedere il permesso? Se un artista sviluppa uno stile simile a quello di Akira Toriyama (o qualsiasi altro autore) potrà vendere illustrazioni originali ispirate a quello stile. Nessuno lo accuserà di violazioni perché la sua opera sarà considerata nuova. Il copyright, infatti, si applica solamente ai prodotti specifici; nel caso di Akira Toriyama (autore di Dragonball) se non si hanno le licenze, non si può copiare il personaggio di Goku (o altri di quell’universo narrativo), nemmeno se si usa un altro stile artistico. Questo accade perché Goku è un personaggio facilmente riconoscibile con caratteristiche immutabili, per non violare il copyright bisognerebbe creare un personaggio diverso.
Se il copyright fosse applicato allo stile le conseguenze risulterebbero deleterie per l’innovazione artistica nel suo complesso. La creazione di qualcosa di nuovo avviene sempre partendo da stili preesistenti, in generale ogni forma d’innovazione deve partire da qualcosa di reale. Se un artista o un gruppo di artisti si organizzassero per avere il copyright su un determinato stile limiterebbe, di fatto, chiunque altro non solo nell'utilizzarlo ma anche nello sperimentare stili simili. Lo stile è un concetto sfumato ed in continuo mutamento; mettere un filtro all’interno di questo processo, potrebbe anche essere possibile, minerebbe però lo sviluppo creativo a livello sociale. Il rapporto costi-benefici risulterebbe, dunque, troppo sbilanciato a favore dei singoli gruppi d’interesse (artisti o gruppi di artisti) che propongono il copyright sul loro ipotetico stile.
Chi sostiene la tesi della violazione di copyright, inoltre, non tiene conto delle differenti regole imposte dalle singole aziende ai propri modelli generativi. ChatGPT, ad esempio, non permette la riproduzione, anche attraverso stili diversi, di un qualsiasi personaggio protetto da copyright; come azienda hanno deciso di tutelare (pur non essendo obbligati) il diritto d’autore, limitando la riproduzione di determinati contenuti. Al contrario MidJourney, uno dei modelli migliori, permette di ricreare qualsiasi personaggio, attraverso qualsiasi stile, delegando possibili responsabilità dell’uso improprio delle opere protette all’utente finale.
IA e creatività
Un'ulteriore critica mossa all’IA riguarda il suo legame con il concetto di creatività. In molti sostengono che le opere fatte con questa tecnologia non abbiano valore creativo o artistico e che potenzialmente potrebbero rubare il lavoro a diversi artisti, sostituendoli con prodotti di poca qualità. L’intelligenza artificiale di per sé è uno strumento inerte; anche se dovesse generare autonomamente i propri prompt, continuerebbe a mancare di caratteristiche fondamentali dell’esperienza umana come: la consapevolezza, l’intenzione, la sensibilità estetica e la capacità di capire il contesto. In altre parole, non sa cosa sta facendo. Può produrre immagini visivamente affascinanti, ma non le comprende, non le giudica e non le sceglie. Per questo motivo non è utile considerarla “creativa” nel senso pieno del termine. La creatività resta, almeno per ora, una prerogativa umana, l’IA è categorizzabile più come strumento: simile ad un pennello, ad una fotocamera od a un software di grafica.
Il valore dell’opera generata con IA, infatti, risiede nel processo umano che la guida. Il primo passo, ovvero la creazione del prompt, risulta fondamentale per determinare la qualità dell’immagine e richiede notevoli competenze linguistiche, tecniche e strategiche oltre che immaginative. Il processo non si limita al creare prompt: spesso, infatti, si susseguono decine di tentativi, modifiche, selezioni e variazioni. L’autore osserva, giudica, corregge, fino a trovare l’immagine che meglio rispecchia il proprio gusto o l’idea che vuole esprimere. In questa catena di scelte, nella relazione tra intenzione e risultato, si manifesta la creatività umana. L’IA accelera il processo, ma non lo sostituisce perché l’autore resta responsabile della direzione e del senso dell’opera.
Questa visione sta cominciando a farsi strada anche a livello legislativo. Il Tribunale di Pechino, il 27 novembre 2023, ha emesso una sentenza in cui riconosce la protezione legale a un’opera generata tramite IA, perché il processo era stato guidato in modo determinante dall'autore umano, che aveva costruito il prompt e selezionato il risultato, creando così un’opera originale. Anche in Italia, la Corte di Cassazione, con l’ordinanza n. 1107/2023, ha stabilito un principio chiave: l’uso di un software non esclude di per sé il processo creativo. Risulta, infatti, necessario valutare caso per caso, per capire in quale misura il risultato finale sia stato determinato dalla macchina o dall’intervento umano.
Usare un’intelligenza artificiale per generare immagini non significa rinunciare alla creatività, ma trasformarla. Questa tecnologia trasforma l’utente nel direttore artistico del proprio prodotto: non si impugna direttamente il pennello, ma si guida l’intero processo creativo, dall’idea iniziale al risultato finale. Ogni immagine generata è il frutto di una visione, affinata da prove, errori, aggiustamenti e intuizioni. L’IA diventa così una squadra di assistenti instancabili, ma è ancora l’umano a stabilire cosa ha valore, cosa va tenuto, cosa va scartato. La vera opera, allora, non è solo l’immagine singola, ma il percorso che porta a selezionarla e darle un senso.
Tecnologia e talento
In un'ottica più generale, i dibattiti su questi temi invitano a riflettere sul rapporto tra tecnologia e talento. I talenti umani non sono assoluti o fissi nel tempo: dipendono anche dagli strumenti disponibili in un certo momento storico. Prima del 1839, anno in cui viene generalmente riconosciuta la nascita ufficiale della fotografia, questa tecnica non esisteva, ma non per questo non esistevano persone che avrebbero potuto eccellere in essa. Semplicemente, non avevano la possibilità di scoprirlo. Lo stesso vale oggi per l’IA. Può darsi che, nel presente, non riusciamo ancora a capire del tutto il suo senso artistico, perché ci troviamo nella fase iniziale, quella più incerta e rumorosa. Ma è plausibile che col tempo emergeranno creativi, artisti, narratori visivi che grazie a questa tecnologia riusciranno a dare forma alla propria immaginazione in modi nuovi e potenti, magari impensabili con i mezzi tradizionali.
La tecnologia, in questo senso, non toglie valore al talento umano, ma può rivelarlo, portarlo alla luce, offrendogli nuove strade per esprimersi. Da questo discorso si può dedurre che l’uso professionale di questi strumenti, sebbene più accessibile e veloce rispetto ad altri, non sia affatto semplice. Il concetto che sembra descrivere meglio questa tecnologia è l’ormai classico "easy to play, hard to master" di derivazione videoludica: ovvero uno strumento che all’inizio appare semplice da usare (basta scrivere “creami un’immagine”) ma che, per produrre risultati di valore, richiede un investimento di tempo notevole. Anche perché la competizione è elevata, proprio in virtù della sua grande accessibilità.
Infine, non è affatto scontato che l’intelligenza artificiale “rubi il lavoro” agli artisti. Dati i suoi limiti attuali forse è più realistico immaginare un affiancamento intelligente, in cui l’IA diventa un supporto potente, capace di velocizzare o semplificare alcuni passaggi, soprattutto nelle mani di persone già esperte e formate nel settore, che sanno come impostare e gestire un lavoro artistico.
