Tecnologia "text-to-image"

Questa copertina l'ha creata (più o meno) un'intelligenza artificiale, in venti secondi

Partendo da immagini di un'artista e da istruzioni testuali, Dall-E 2 "inventa" la cover di Cosmopolitan Usa. Ed è solo l'inizio di una rivoluzione nell'arte

Questa copertina l'ha creata (più o meno) un'intelligenza artificiale, in venti secondi
(Twitter/@Cosmopolitan)
PSA: l'intelligenza artificiale più intelligente del mondo (aka @OpenAI ) ha realizzato questa copertina di Cosmopolitan

Questa copertina di Cosmopolitan Usa è stata presentata come “il primo caso di una creazione grafica prodotta da un'intelligenza artificiale”. La cover "tecnologica" è una creazione di OpenAI denominata Dall-E 2. Si tratta di un'intelligenza artificiale che riceve richieste verbali  e attraverso la sua “conoscenza”, un database che comprende centinaia di milioni di immagini - che ormai coprono praticamente lo scibile umano - crea da sola le proprie immagini, pixel per pixel, dando origine a un prodotto del tutto nuovo e originale. 

 

Opere di Karen E. Cheng per Cosmopolitan Usa Cosmopolitan/Twitter
Opere di Karen E. Cheng per Cosmopolitan Usa

L'uso di questa tecnologia non è nuovissimo: Dall-E era già stato usato più di un anno e mezzo fa per creare la cosiddetta “poltrona avocado”, come spiega in questo articolo Enrico Santus: 

Questo, ad esempio, è il caso dell’immagine generata da Dall-E (nome da leggere “dall-i”, in maniera simile al pittore surrealista Salvador Dalì) di Open AI a partire dalla frase “poltrona a forma di avocado”. Il prodotto di Dall-E sottende non solo capacità creative, ma anche di comprensione del mondo: infatti, il modello ha dovuto riconoscere gli elementi costituenti e identificativi sia dell’avocado (la forma arrotondata, il colore, etc.) che della poltrona (i piedi, gli appoggiabraccia, etc.) per poterli poi fondere armoniosamente. 

Avocado armchair Open AI
Avocado armchair

Dall-E (ormai alla seconda versione) non solo crea l'immagine, ma lo fa in praticamente tutti gli stili desiderati come "acquerello", "nello stile di van Gogh" e così via. I risultati sono sorprendentemente buoni, motivo per cui, dalla sua uscita  ad aprile, limitata ad alcuni beta tester, Dall-E 2 ha destato stupore e anche soggezione nelle persone che hanno visto il suo potenziale

The Verge, la ‘bibbia tech’, ha dichiarato che Dall-E "potrebbe dare il via a una rivoluzione creativa". E la celebrità di YouTube, Marques Brownlee, si è chiesto: "L'AI potrà sostituire il nostro artista grafico?" Cosmopolitan spiega che, in una riunione su Zoom,  ci è voluta meno di un'ora per creare la copertina, rinfocolando gli interrogativi su Ai e arte, che vanno oltre il design grafico di una rivista ma riguardano anche l'etica e il nostro futuro.

Open AI ha come concorrente un gigante tecnologico del calibro di Google: Dall-E è stato infatti recentemente sorpassato da Imagen, rilasciato nei giorni scorsi da Google Brain. I due modelli puntano alla creazioni di immagini a partire da un testo ("text-to-image"), ma Imagen ha già dimostrato una potenzialità superiore nella comprensione del linguaggio umano, il fine ultimo di questi modelli di intelligenza artificiale. 

Per questo motivo Google non ha fatto un rilascio di Imagen al pubblico: l'azienda dà accesso a beta tester selezionati e filtra alcuni input di testo, nel tentativo di impedire che il modello venga utilizzato per generare immagini razziste, violente o pornografiche

Google ritiene che Imagen "non sia adatto per l'uso pubblico in questo momento" e afferma di voler sviluppare un nuovo modo per combattere i "pregiudizi sociali e culturali nel lavoro futuro". Per ora, dobbiamo accontentarci di simpatici orsetti e immaginare le potenziali applicazioni di questa tecnologia.

Imagen, a text-to-image diffusion model: robot a cena in un ristorante raffinato Google
Imagen, a text-to-image diffusion model: robot a cena in un ristorante raffinato