In questi giorni stanno imperversando sui social gli esperimenti di immagini generate su ChatGPT. Che siano generazione di fumetti o trasformazione di foto in stili diversi (il Ghibli in particolare...) in molti si stanno divertendo a sfruttare le nuove funzinalità di questo potente strumento.
Si chiama ChatGPT Image Generator ed è uno strumento integrato direttamente in ChatGPT, basato sul modello GPT-4o, che consente di generare immagini a partire dal testo.
Fino a poco tempo fa, questa opzione era disponibile solo per gli utenti paganti. Ma ora chiunque abbia un account gratuito può utilizzarlo, anche se con alcune restrizioni.
Sebbene OpenAI non abbia specificato ufficialmente il limite esatto per gli utenti gratuiti, ho verificato che il limite reste di tre immagini al giorno. Cioè, potete provare lo strumento, ma se volete generare molte varianti o effettuare test più avanzati, dovete aspettare fino al giorno successivo o abbonarvi.
Ovviamente la possibilità di generare immagini da testo può comportare rischi correlati ad un uso improrpio dello strumento. C'è stata anche una controversia sulla facilità con cui il generatore imita lo stile dello Studio Ghibli, l'iconica casa di animazione giapponese. Ciò ha riacceso il dibattito sul diritto d'autore e sull'addestramento dei modelli di intelligenza artificiale con opere esistenti.
Come faccio a sapere se un'immagine è stata creata con ChatGPT?
Le immagini generate con questo strumento contengono metadati incorporati che ne specificano l'origine. Ciò, in teoria, dovrebbe renderli più facili da identificare e impedire che vengano utilizzati in modo ingannevole.
Come potete vedere dall'esempio sopra, è possibile anche chiedere di generare una striscia di fumetti, inserendo prompt dettagliati. In questo caso ecco cosa ho inserito:
" Genera una sequenza di tre vignette di un fumetto storico realistico, ambientato nel Medioevo (XIII secolo), con colori desaturati e dettagli ispirati ai manoscritti miniati medievali. L’illuminazione è drammatica, con giochi di luce che evidenziano il contrasto tra il potere e il popolo. Prima vignetta: Un giovane monaco amanuense, con una tunica marrone e il capo coperto dal cappuccio, è seduto in uno scriptorium illuminato da candele. Sta copiando segretamente un testo proibito su un pezzo di pergamena. Dietro di lui, un'ombra inquietante si allunga sul muro: è l’inquisitore che lo sta osservando. Seconda vignetta: Il monaco viene trascinato fuori dall’abbazia da due guardie in armatura, mentre un vescovo con uno sguardo severo indica il manoscritto confiscato. Attorno, i contadini del villaggio guardano la scena con paura e sussurrano tra loro. Il cielo è coperto da nubi scure, accentuando la tensione. Terza vignetta: Il monaco, ora davanti a un tribunale dell’Inquisizione, è incatenato ma tiene lo sguardo fiero. Sul banco del giudice, il manoscritto è aperto, e il vescovo sembra indeciso se condannarlo o meno. Nell'ombra, un nobile illuminato dalla luce di una torcia osserva la scena con interesse: potrebbe esserci una speranza di salvezza?"
Mi sono anche divertito a trasformare una foto in Ghibli style, ed ecco il risultato: